出版物

Lidong Lu, Guo Chen, Zhu Wei, Zhiqi Li, Yicheng Liu, Tong Lu (2026). AV-Reasoner: Improving and Benchmarking Clue-Grounded Audio-Visual Counting for MLLMs. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Xinhao Li, Yi Wang, Jiashuo Yu, Xiangyu Zeng, Yuhan Zhu, Haian Huang, Jianfei Gao, Kunchang Li, Yinan He, Chenting Wang, Yu Qiao, Yali Wang, Limin Wang (2026). VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling. The Fourteenth International Conference on Learning Representations.

引用 URL

Zhengrong Yue, Haiyu Zhang, Xiangyu Zeng, Boyu Chen, Chenting Wang, Shaobin Zhuang, Lu Dong, KunPeng Du, Yi Wang, Limin Wang, Yali Wang (2026). UniFlow: A Unified Pixel Flow Tokenizer for Visual Understanding and Generation. The Fourteenth International Conference on Learning Representations.

引用 URL

Renfei Dang, Zhening Li, Shujian Huang, Jiajun Chen (2026). The First Impression Problem: Internal Bias Triggers Overthinking in Reasoning Models. The Fourteenth International Conference on Learning Representations.

引用 URL

Yansong Shi, Qingsong Zhao, Tianxiang Jiang, Xiangyu Zeng, Yi Wang, Limin Wang (2026). RIVER: Real-time Video Interaction Benchmark. The Fourteenth International Conference on Learning Representations.

引用 URL

Yize Jiang, Xinze Li, Yuanyuan Zhang, Jin Han, Youjun Xu, Ayush Pandit, Zaixi Zhang, Mengdi Wang, Mengyang Wang, Chong Liu, Guang Yang, Yejin Choi, Yingzhou Lu, Wu-Jun Li, Tianfan Fu, Fang Wu, Junhong Liu (2026). PoseX: AI Defeats Physics-based Methods on Protein Ligand Cross-Docking. The Fourteenth International Conference on Learning Representations.

引用 URL

Shuai Wang, Ziteng Gao, Chenhui Zhu, Weilin Huang, Limin Wang (2026). PixNerd: Pixel Neural Field Diffusion. The Fourteenth International Conference on Learning Representations.

引用 URL

Tao Bu, Qiangang Wang, Bowen Zeng, Hanwen Sun, Yunpeng Huang, Chun Cao, Jingwei Xu (2026). Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism. The Fourteenth International Conference on Learning Representations.

引用 URL

Shuaijie She, Yu Bao, Yu Lu, Lu Xu, Tao Li, Wenhao Zhu, Jianbing Zhang, Shujian Huang, Shanbo Cheng, Lu Lu, Yuxuan Wang (2026). DuPO: Enabling Reliable Self-Verification via Dual Preference Optimization. The Fourteenth International Conference on Learning Representations.

引用 URL

Yifan Xu, Xinhao Li, Yichun Yang, Desen Meng, Rui Huang, Limin Wang (2026). CaReBench: A Fine-grained Benchmark for Video Captioning and Retrieval. The Fourteenth International Conference on Learning Representations.

引用 URL