This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Yanzhe Hu, Yijie Jin, Pengfei Liu, Kai Yu, Zhijie Deng

Articles by Yanzhe Hu, Yijie Jin, Pengfei Liu, Kai Yu, Zhijie Deng

Academic · 1 min

LightningRL: Breaking the Accuracy-Parallelism Trade-off of Block-wise dLLMs via Reinforcement Learning

arXiv:2603.13319v1 Announce Type: new Abstract: Diffusion Large Language Models (dLLMs) have emerged as a promising paradigm for parallel token generation, with block-wise variants garnering significant …

39 views Mar 17

Yanzhe Hu, Yijie Jin, Pengfei Liu, Kai Yu, Zhijie Deng

Articles by Yanzhe Hu, Yijie Jin, Pengfei Liu, Kai Yu, Zhijie Deng

LightningRL: Breaking the Accuracy-Parallelism Trade-off of Block-wise dLLMs via Reinforcement Learning

JCG, PC

HSOLLC Co., Ltd.