STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability
提出STARE(Surprisal-guided Token-level Advantage Reweighting),通过比率调节确保策略熵稳定,在1.5B到32B模型上提升准确率4%-8%。
Haipeng Luo, Qingfeng Sun, Songli Wu 等
提出STARE(Surprisal-guided Token-level Advantage Reweighting),通过比率调节确保策略熵稳定,在1.5B到32B模型上提升准确率4%-8%。
Haipeng Luo, Qingfeng Sun, Songli Wu 等
提出基于LLM的零样本主动特征获取框架,利用最大熵闭包解决判别统计的标度模糊,显著提升IBD患者诊断准确率。
Binyamin Perets, Natalie Mendelson, Shiran Vainberg 等
提出UniAR,采用单一离散视觉标记器实现视觉理解与生成的统一,显著提升图像生成与编辑性能。
Wujian Peng, Lingchen Meng, Yuxuan Cai 等
提出VERITAS框架,通过推理时验证提升机器人策略性能,无需额外训练,验证提升成功率达10%。
Mingtong Zhang, Dhruv Shah
提出EventDrive,结合事件相机与视觉-语言模型,提升自动驾驶中的感知、理解、预测与规划能力。
Dongyue Lu, Rong Li, Ao Liang 等
提出循环世界模型(LoopWM),通过参数共享的变换器迭代优化潜在状态,提升参数效率达100倍,适应复杂预测需求。
Hongyuan Adam Lu, Z. L. Victor Wei, Qun Zhang 等
RubricsTree构建了基于专家对100+临床验证布尔评分的层级分类体系,用于大规模、可演化的个人健康AI评估,显著优于行业基线。
Weizhi Zhang, Zechen Li, Hamid Palangi 等
提出DRFLOW基准,结合7项指标评估个性化深度研究工作流预测,涵盖100任务和1246步骤。
Md Tawkat Islam Khondaker, Raymond Li, Muhammad Abdul-Mageed 等
构建包含870会话、2.3百万事件的多源日志数据集,标注基于ATT&CK技术,利用LoRA微调三款小型语言模型提升检测性能。
Abir Ashab Niloy, Ahmed Ryan, Imamul Hossain Rafi 等
引入Kolmogorov偏微分方程,提升扩散策略的鲁棒性,实验证明在推挤操控和制造线应用中性能显著改善。
Lekan Molu
提出基于轻量脉冲神经网络的声事件检测触发器,F1达0.97,显著降低计算复杂度42.6倍。
Benjamin Hatton, Oliver Rhodes, Luca Peres
本研究提出RecLoop框架,比较生成式推荐与传统推荐在信息茧房中的表现,发现生成式推荐在曝光多样性方面表现优越,但仍受反馈循环影响。
Jiyuan Yang, Gengxin Sun, Mengqi Zhang 等
本研究基于MetaSyn数据集,评估12种LLM管道在自然出版物元分析中的表现,揭示筛选瓶颈,最大召回率90.9%,实际检索覆盖不足52.7%。
Anzhe Xie, Weihang Su, Yujia Zhou 等
R2RDreamer通过3D感知数据增强,提升二维操控策略的空间泛化能力,利用2D视频空间的视觉补全实现高效仿真增强。
Xiuwei Xu, Haowen Sun, Angyuan Ma 等
提出Qwen-RobotWorld,基于双流MMDiT和大规模动作-语言映射,利用8.6M视频文本数据实现跨场景机器人模拟,性能优越。
Jie Zhang, Xiaoyue Chen, Anzhe Chen 等
MeshLoom是一种基于前馈神经网络的非刚性网格序列配准方法,能在秒级完成多帧Mesh的高精度变形重建。
Jianqi Chen, Jiraphon Yenphraphai, Xiangjun Tang 等
利用Kendall形状空间和Riemannian几何构建形状分析框架,揭示生物形态变异的内在结构。
Gary P. T. Choi, Khanh Dao Duc, Shira Faigenbaum-Golovin 等
TuneJury是一种基于成对偏好预测的音乐生成奖励模型,在17.5K人类偏好对上训练,准确率达0.7086,显著优于无伪标签模型。
Yonghyun Kim, Junwon Lee, Haiwen Xia 等
提出随机排序风险的理论框架,基于DCG变化分析最坏情况偏差,验证实验显示预测偏差与实际接近。
Debasis Ganguly
提出基于深度学习优化的被动色散光学网络,实现625通道400-750nm范围内的二维波束偏转,定位精度亚波长。
Che-Yung Shen, Yuhang Li, Cagatay Isil 等