TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task Reinforcement Learning

2026年5月5日·

Tao Wu

,

Li Yang

,

Gen Zhan

,

Yabin Zhang

,

Yiting Liao

,

Junlin Li

,

Deliang Fu

,

Li Zhang

Limin Wang

Limin Wang

· 0 分钟阅读时长

引用 URL

类型

出版物

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

最近更新于 2026年5月5日

Limin Wang

Authors

← Rethinking BCE Loss for Multi-Label Image Recognition with Fine-Tuning 2026年5月5日

TimeLens: Rethinking Video Temporal Grounding with Multimodal LLMs 2026年5月5日 →