Batched Kernelized Bandits: Refinements and Extensions
本文提出了批量核化带宽问题的改进和扩展,优化了批次数量和后悔界限。
Chenkai Ma, Keqin Chen, Jonathan Scarlett
本文提出了批量核化带宽问题的改进和扩展,优化了批次数量和后悔界限。
Chenkai Ma, Keqin Chen, Jonathan Scarlett
VLM4Rec通过大规模视觉语言模型实现多模态推荐的语义表示,提升推荐性能。
Ty Valencia, Burak Barlas, Varun Singhal 等
InterDeepResearch通过交互式深度研究实现人机协作的信息检索,提升研究过程的可观察性和实时可控性。
Bo Pan, Lunke Pan, Yitao Zhou 等
提出交替梯度流效用(AGF),在ImageNet-1K上实现75%压缩时避免结构崩溃。
Tianhao Qian, Zhuoxuan Li, Jinde Cao 等
研究通过dropout修剪全连接神经网络,揭示了三种相位:eumentia、dementia和amentia。
Haining Pan, Nakul Aggarwal, J. H. Pixley
EVATok通过自适应长度视频标记化实现高效视觉自回归生成,平均节省24.4%标记。
Tianwei Xiong, Jun Hao Liew, Zilong Huang 等
MM-CondChain通过VPIR实现视觉深层组合推理,最强模型仅达53.33 Path F1。
Haozhan Shen, Shilin Yan, Hongwei Xue 等
OmniStream通过因果时空注意力和3D旋转位置嵌入实现视觉流的感知、重建和动作,跨29个数据集表现优异。
Yibin Yan, Jilan Xu, Shangzhe Di 等
$Ψ_0$模型通过分阶段训练实现了40%的性能提升,仅需800小时人类视频和30小时机器人数据。
Songlin Wei, Hongyi Jing, Boqian Li 等
通过FLUX的变分自编码器潜在空间实现色彩控制,揭示了色相、饱和度和亮度的结构。
Mateusz Pach, Jessica Bader, Quentin Bouniot 等
HumDex系统通过IMU跟踪和学习方法实现便携的人形灵巧操作,提升了数据采集效率和泛化能力。
Liang Heng, Yihe Tang, Jiajun Xu 等
DreamVideo-Omni通过潜在身份强化学习实现多主体视频定制,提升身份保真度和运动控制精度。
Yujie Wei, Xinyu Liu, Shiwei Zhang 等
AutoGaze通过自回归选择多尺度视频片段,减少冗余,提升效率,支持1K帧4K视频处理。
Baifeng Shi, Stephanie Fu, Long Lian 等
EndoCoT通过激活MLLMs的推理潜力,实现了92.1%的准确率,比基线高8.3%。
Xuanlang Dai, Yujie Zhou, Long Xing 等
研究通过推理LLM裁判在不可验证LLM后训练中提高性能,使用gpt-oss-120b作为金标准。
Yixin Liu, Yue Yu, DiJia Su 等
可分离神经架构(SNA)通过约束交互阶数和张量秩,实现统一的预测和生成智能。
Reza T. Batley, Apurba Sarker, Rajib Mostakim 等
BiGain通过频率分离实现加速扩散模型的生成和分类双重优化,提升分类准确率7.15%,FID提高0.34。
Jiacheng Liu, Shengkun Tang, Jiacheng Cui 等
STAMP框架利用极坐标机制在文本隐私保护中实现更优的隐私-效用平衡。
Fengwei Tian, Payel Bhattacharjee, Heidi Hanson 等
通过学习冲突的增量神经网络验证方法在Marabou验证器上实现了最高1.9倍的加速。
Raya Elsaleh, Liam Davis, Haoze Wu 等
通过时间拉直提升潜在规划的表现,成功率提高20-60%。
Ying Wang, Oumayma Bounou, Gaoyue Zhou 等