cs.CL
2603.09881
Do What I Say: A Spoken Prompt Dataset for Instruction-Following
引入DOWIS数据集,评估语音大语言模型在多语言环境下的指令跟随能力,发现文本提示优于语音提示。
Maike Züfle, Sara Papi, Fabian Retkowski 等
2026-03-11
12