This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Xiaoyi Li

Articles by Xiaoyi Li

Academic · 1 min

Do Post-Training Algorithms Actually Differ? A Controlled Study Across Model Scales Uncovers Scale-Dependent Ranking Inversions

arXiv:2603.19335v1 Announce Type: new Abstract: Post-training alignment has produced dozens of competing algorithms -- DPO, SimPO, KTO, GRPO, and others -- yet practitioners lack controlled …

Xiaoyi Li

8 views Mar 23

Academic · 1 min

Auto Researching, not hyperparameter tuning: Convergence Analysis of 10,000 Experiments

arXiv:2603.15916v1 Announce Type: new Abstract: When LLM agents autonomously design ML experiments, do they perform genuine architecture search -- or do they default to hyperparameter …

Xiaoyi Li

7 views Mar 18

Xiaoyi Li

Articles by Xiaoyi Li

Do Post-Training Algorithms Actually Differ? A Controlled Study Across Model Scales Uncovers Scale-Dependent Ranking Inversions

Auto Researching, not hyperparameter tuning: Convergence Analysis of 10,000 Experiments

JCG, PC

HSOLLC Co., Ltd.