GlyphPrinter: Region-Grouped Direct Preference Optimization for Glyph-Accurate Visual Text Rendering
GlyphPrinter通过区域分组直接偏好优化提升字形精度,超越现有方法。
Xincheng Shuai, Ziye Li, Henghui Ding 等
GlyphPrinter通过区域分组直接偏好优化提升字形精度,超越现有方法。
Xincheng Shuai, Ziye Li, Henghui Ding 等
使用稀疏自编码器纠正语言模型的道德冷漠,提升75%对抗性基准胜率。
Lingyu Li, Yan Teng, Yingchun Wang
Tri-Prompting方法在多视角主体一致性和运动精度上显著优于Phantom和DaS。
Zhenghong Zhou, Xiaohang Zhan, Zhiqin Chen 等
HSImul3R通过物理反馈优化实现稳定的人-场景交互3D重建,显著提升模拟稳定性。
Yukang Cao, Haozhe Xie, Fangzhou Hong 等
Code-A1通过对抗性共进化框架,提升代码生成和测试生成能力。
Aozhe Wang, Yuchen Yan, Nan Zhou 等
研究发现反事实解释的算法指标与用户感知不一致,需更人性化的评估方法。
Felix Liedeker, Basil Ell, Philipp Cimiano 等
PRIMO R1通过强化学习将视频MLLMs转变为主动“批评者”,在RoboFail基准上达到67.0%准确率。
Yibin Liu, Yaxing Lyu, Daqi Gao 等
OpenSeeker通过开放训练数据,利用可控问答合成和去噪轨迹合成,实现前沿搜索代理的民主化。
Yuwen Du, Rui Ye, Shuo Tang 等
通过有效蒸馏,将xLSTM架构应用于大型语言模型,恢复甚至超越教师模型性能。
Lukas Hauzenberger, Niklas Schmidinger, Thomas Schmied 等
提出了一种将人类心灵视为操作系统的认知架构,用于构建人工通用智能。
Anton Kolonin, Vladimir Krykov
使用ResNet和VGG等机器学习模型在4D-STEM中实现铁电体极化方向映射,准确率达99.8%。
Matej Martinc, Goran Dražič, Anton Kokalj 等
Lore协议通过git trailers将提交信息转化为结构化知识,提升AI编码代理的决策记录。
Ivan Stetsenko
PokeAgent挑战通过Pokemon战斗和RPG环境测试AI决策能力,提供20M+数据集和标准化评估框架。
Seth Karten, Jake Grigsby, Tersoo Upaa 等
PhysMoDPO通过偏好优化生成符合物理的类人运动,提升真实感和任务性能。
Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov 等
采用联合嵌入预测架构(JEPA)在潜在空间中学习物理系统表示,显著提高参数估计精度。
Helen Qu, Rudy Morel, Michael McCabe 等
Visual-ERM通过细粒度视觉奖励提升视觉到代码任务性能,显著超越现有模型。
Ziyu Liu, Shengyuan Ding, Xinyu Fang 等
STEVO-Bench评估视频世界模型在观察中断时的状态演化能力,揭示其局限性。
Ziqi Ma, Mengzhan Liufu, Georgia Gkioxari
NAIT框架通过神经元激活模式选择高效指令微调数据,提升LLM性能。
Xin Chen, Junchao Wu, Shu Yang 等
QMatSuite平台通过知识整合将AI在材料科学中的推理开销减少67%,准确性提高至3%。
Haonan Huang
通过CWRF方法,仅调整关键权重以在保持效用的同时增强隐私保护。
Xingli Fang, Jung-Eun Kim