PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning

2026年5月8日·

Yunzhi Shen

,

Hao Zhou

,

Xin Huang

,

Xue Han

,

Junlan Feng

Shujian Huang

Shujian Huang

· 0 分钟阅读时长

引用 URL

类型

出版物

Findings of the Association for Computational Linguistics: ACL 2026

最近更新于 2026年5月8日

← How Do Answer Tokens Read Reasoning Traces? Self-Reading Patterns in Thinking LLMs for Quantitative Reasoning 2026年5月8日

Reasoning While Asking: Transforming Reasoning Large Language Models from Passive Solvers to Proactive Inquirers 2026年5月8日 →