This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Yifeng Liu, Siqi Ouyang, Yatish Hosmane Revanasiddappa, Lei Li

Articles by Yifeng Liu, Siqi Ouyang, Yatish Hosmane Revanasiddappa, Lei Li

Academic · 1 min

Mending the Holes: Mitigating Reward Hacking in Reinforcement Learning for Multilingual Translation

arXiv:2603.13045v1 Announce Type: new Abstract: Large Language Models (LLMs) have demonstrated remarkable capability in machine translation on high-resource language pairs, yet their performance on low-resource …

18 views Mar 16

Yifeng Liu, Siqi Ouyang, Yatish Hosmane Revanasiddappa, Lei Li

Articles by Yifeng Liu, Siqi Ouyang, Yatish Hosmane Revanasiddappa, Lei Li

Mending the Holes: Mitigating Reward Hacking in Reinforcement Learning for Multilingual Translation

JCG, PC

HSOLLC Co., Ltd.