This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Shaopeng Fu, Xingxing Zhang, Li Dong, Di Wang, Furu Wei

Articles by Shaopeng Fu, Xingxing Zhang, Li Dong, Di Wang, Furu Wei

Academic · 1 min

RefineRL: Advancing Competitive Programming with Self-Refinement Reinforcement Learning

arXiv:2604.00790v1 Announce Type: new Abstract: While large language models (LLMs) have demonstrated strong performance on complex reasoning tasks such as competitive programming (CP), existing methods …

1 views Apr 3

Shaopeng Fu, Xingxing Zhang, Li Dong, Di Wang, Furu Wei

Articles by Shaopeng Fu, Xingxing Zhang, Li Dong, Di Wang, Furu Wei

RefineRL: Advancing Competitive Programming with Self-Refinement Reinforcement Learning

JCG, PC

HSOLLC Co., Ltd.