This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Chi Ruan, Dongfu Jiang, Huaye Zeng, Ping Nie, Wenhu Chen

Articles by Chi Ruan, Dongfu Jiang, Huaye Zeng, Ping Nie, Wenhu Chen

Academic · 1 min

EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning

arXiv:2603.12698v1 Announce Type: new Abstract: Reinforcement learning with verifiable rewards (RLVR) is a promising approach for improving code generation in large language models, but its …

23 views Mar 16

Chi Ruan, Dongfu Jiang, Huaye Zeng, Ping Nie, Wenhu Chen

Articles by Chi Ruan, Dongfu Jiang, Huaye Zeng, Ping Nie, Wenhu Chen

EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning

JCG, PC

HSOLLC Co., Ltd.