Paper 解读 - Arxiv 论文中文解读平台

cs.CV 2603.15616

GlyphPrinter: Region-Grouped Direct Preference Optimization for Glyph-Accurate Visual Text Rendering

GlyphPrinter通过区域分组直接偏好优化提升字形精度，超越现有方法。

Xincheng Shuai, Ziye Li, Henghui Ding 等

2026-03-17 1 引用 115

cs.CL 2603.15615

Mechanistic Origin of Moral Indifference in Language Models

使用稀疏自编码器纠正语言模型的道德冷漠，提升75%对抗性基准胜率。

Lingyu Li, Yan Teng, Yingchun Wang

2026-03-17 93

cs.CV 2603.15614

Tri-Prompting: Video Diffusion with Unified Control over Scene, Subject, and Motion

Tri-Prompting方法在多视角主体一致性和运动精度上显著优于Phantom和DaS。

Zhenghong Zhou, Xiaohang Zhan, Zhiqin Chen 等

2026-03-17 171

cs.CV 2603.15612

HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions

HSImul3R通过物理反馈优化实现稳定的人-场景交互3D重建，显著提升模拟稳定性。

Yukang Cao, Haozhe Xie, Fangzhou Hong 等

2026-03-17 106

cs.CL 2603.15611

Code-A1: Adversarial Evolving of Code LLM and Test LLM via Reinforcement Learning

Code-A1通过对抗性共进化框架，提升代码生成和测试生成能力。

Aozhe Wang, Yuchen Yan, Nan Zhou 等

2026-03-17 2 引用 88

cs.AI 2603.15607

Do Metrics for Counterfactual Explanations Align with User Perception?

研究发现反事实解释的算法指标与用户感知不一致，需更人性化的评估方法。

Felix Liedeker, Basil Ell, Philipp Cimiano 等

2026-03-17 119

cs.RO 2603.15600

From Passive Observer to Active Critic: Reinforcement Learning Elicits Process Reasoning for Robotic Manipulation

PRIMO R1通过强化学习将视频MLLMs转变为主动“批评者”，在RoboFail基准上达到67.0%准确率。

Yibin Liu, Yaxing Lyu, Daqi Gao 等

2026-03-17 82

cs.AI 2603.15594

OpenSeeker: Democratizing Frontier Search Agents by Fully Open-Sourcing Training Data

OpenSeeker通过开放训练数据，利用可控问答合成和去噪轨迹合成，实现前沿搜索代理的民主化。

Yuwen Du, Rui Ye, Shuo Tang 等

2026-03-17 3 引用 305

cs.LG 2603.15590

Effective Distillation to Hybrid xLSTM Architectures

通过有效蒸馏，将xLSTM架构应用于大型语言模型，恢复甚至超越教师模型性能。

Lukas Hauzenberger, Niklas Schmidinger, Thomas Schmied 等

2026-03-17 133

cs.AI 2603.15586

Computational Concept of the Psyche

提出了一种将人类心灵视为操作系统的认知架构，用于构建人工通用智能。

Anton Kolonin, Vladimir Krykov

2026-03-17 93

cond-mat.mtrl-sci 2603.15582

Benchmarking Machine Learning Approaches for Polarization Mapping in Ferroelectrics Using 4D-STEM

使用ResNet和VGG等机器学习模型在4D-STEM中实现铁电体极化方向映射，准确率达99.8%。

Matej Martinc, Goran Dražič, Anton Kokalj 等

2026-03-17 84

cs.SE 2603.15566

Lore: Repurposing Git Commit Messages as a Structured Knowledge Protocol for AI Coding Agents

Lore协议通过git trailers将提交信息转化为结构化知识，提升AI编码代理的决策记录。

Ivan Stetsenko

2026-03-17 121

cs.LG 2603.15563

The PokeAgent Challenge: Competitive and Long-Context Learning at Scale

PokeAgent挑战通过Pokemon战斗和RPG环境测试AI决策能力，提供20M+数据集和标准化评估框架。

Seth Karten, Jake Grigsby, Tersoo Upaa 等

2026-03-17 10 引用 151

cs.LG 2603.13228

PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization

PhysMoDPO通过偏好优化生成符合物理的类人运动，提升真实感和任务性能。

Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov 等

2026-03-14 126

cs.LG 2603.13227

Representation Learning for Spatiotemporal Physical Systems

采用联合嵌入预测架构（JEPA）在潜在空间中学习物理系统表示，显著提高参数估计精度。

Helen Qu, Rudy Morel, Michael McCabe 等

2026-03-14 2 引用 138

cs.CV 2603.13224

Visual-ERM: Reward Modeling for Visual Equivalence

Visual-ERM通过细粒度视觉奖励提升视觉到代码任务性能，显著超越现有模型。

Ziyu Liu, Shengyuan Ding, Xinyu Fang 等

2026-03-14 105

cs.CV 2603.13215

Out of Sight, Out of Mind? Evaluating State Evolution in Video World Models

STEVO-Bench评估视频世界模型在观察中断时的状态演化能力，揭示其局限性。

Ziqi Ma, Mengzhan Liufu, Georgia Gkioxari

2026-03-14 123

cs.CL 2603.13201

Neuron-Aware Data Selection In Instruction Tuning For Large Language Models

NAIT框架通过神经元激活模式选择高效指令微调数据，提升LLM性能。

Xin Chen, Junchao Wu, Shu Yang 等

2026-03-14 197

physics.comp-ph 2603.13191

From Experiments to Expertise: Scientific Knowledge Consolidation for AI-Driven Computational Research

QMatSuite平台通过知识整合将AI在材料科学中的推理开销减少67%，准确性提高至3%。

Haonan Huang

2026-03-14 175

cs.LG 2603.13186

Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights

通过CWRF方法，仅调整关键权重以在保持效用的同时增强隐私保护。

Xingli Fang, Jung-Eun Kim

2026-03-14 1 引用 118