出版物

Cheng Liang, Haoxian Chen, Liang Hou, Qi Fan, Gangshan Wu, Xin Tao, Limin Wang (2026). VMonarch: Efficient Video Diffusion Transformers with Structured Attention. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Min Yang, Xinwen Zhang, Jialei Tang, Xin Zhou, Kehan Li, Zeyi Huang, Limin Wang (2026). VideoRealBench: A Chain-of-Thought Realism Evaluation Benchmark for Generated Human-Centric Videos. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Guozhen Zhang, Zixiang Zhou, Teng Hu, Ziqiao Peng, Youliang Zhang, Yi Chen, Yuan Zhou, Qinglin Lu, Limin Wang (2026). UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Jun Zhang, Teng Wang, Yuying Ge, Yixiao Ge, Xinhao Li, Limin Wang (2026). TimeLens: Rethinking Video Temporal Grounding with Multimodal LLMs. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Tao Wu, Li Yang, Gen Zhan, Yabin Zhang, Yiting Liao, Junlin Li, Deliang Fu, Li Zhang, Limin Wang (2026). TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task Reinforcement Learning. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Ao Zhou, Zhiwei Jiang, Zifeng Cheng, Cong Wang, Yafeng Yin, Shufan Yang, Qing Gu (2026). Rethinking BCE Loss for Multi-Label Image Recognition with Fine-Tuning. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Chenting Wang, Yuhan Zhu, Yicheng Xu, Jiange Yang, Ziang Yan, Yali Wang, Yi Wang, Limin Wang (2026). InternVideo-Next: Towards World-Understanding Video Models. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Shuai Wang, Zhi Tian, Weilin Huang, Limin Wang (2026). DDT: Decoupled Diffusion Transformer. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Jiange Yang, Yansong Shi, Haoyi Zhu, Mingyu Liu, Kaijing Ma, Yating Wang, Gangshan Wu, Tong He, Limin Wang (2026). CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL

Guangchen Shi, Yirui Wu, Wei Zhu, Tao Wang, Hao Zhang, Bo Li, Tong Lu (2026). Bayesian Decomposition and Semantic Completion for Few-shot Semantic Segmentation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 URL