排序: 最新 热门 引用
cs.IR 2603.11486

Quantized Inference for OneRec-V2

OneRec-V2通过FP8量化推理实现49%延迟减少和92%吞吐量提升。

Yi Su, Xinchen Luo, Hongtao Cheng 等

2026-03-12 8
cs.CL 2603.10910

GLM-OCR Technical Report

GLM-OCR结合CogViT视觉编码器和GLM语言解码器,提升文档理解效率。

Shuaiqi Duan, Yadong Xue, Weihan Wang 等

2026-03-11 12