PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning 2026年5月8日· Yunzhi Shen , Hao Zhou , Xin Huang , Xue Han , Junlan Feng Shujian Huang · 0 分钟阅读时长 引用 URL 类型 会议文章 出版物 Findings of the Association for Computational Linguistics: ACL 2026 最近更新于 2026年5月8日 ← How Do Answer Tokens Read Reasoning Traces? Self-Reading Patterns in Thinking LLMs for Quantitative Reasoning 2026年5月8日 Reasoning While Asking: Transforming Reasoning Large Language Models from Passive Solvers to Proactive Inquirers 2026年5月8日 →