VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling 2026年4月24日· Xinhao Li , Yi Wang , Jiashuo Yu , Xiangyu Zeng , Yuhan Zhu , Haian Huang , Jianfei Gao , Kunchang Li , Yinan He , Chenting Wang , Yu Qiao , Yali Wang Limin Wang · 0 分钟阅读时长 引用 URL 类型 会议文章 出版物 The Fourteenth International Conference on Learning Representations 最近更新于 2026年4月24日 Authors Limin Wang 南京大学 ← UniFlow: A Unified Pixel Flow Tokenizer for Visual Understanding and Generation 2026年4月24日 3D interaction geometric pre-training for molecular relational learning 2025年10月11日 →