VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling

2026年4月24日·

Xinhao Li

,

Yi Wang

,

Jiashuo Yu

,

Xiangyu Zeng

,

Yuhan Zhu

,

Haian Huang

,

Jianfei Gao

,

Kunchang Li

,

Yinan He

,

Chenting Wang

,

Yu Qiao

,

Yali Wang

Limin Wang

Limin Wang

· 0 分钟阅读时长

引用 URL

类型

出版物

The Fourteenth International Conference on Learning Representations

最近更新于 2026年4月24日

Limin Wang

Authors

← UniFlow: A Unified Pixel Flow Tokenizer for Visual Understanding and Generation 2026年4月24日

3D interaction geometric pre-training for molecular relational learning 2025年10月11日 →