This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

Articles by Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

Academic · 1 min

AIMER: Calibration-Free Task-Agnostic MoE Pruning

arXiv:2603.18492v1 Announce Type: new Abstract: Mixture-of-Experts (MoE) language models increase parameter capacity without proportional per-token compute, but the deployment still requires storing all experts, making …

6 views Mar 20

Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

Articles by Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

AIMER: Calibration-Free Task-Agnostic MoE Pruning

JCG, PC

HSOLLC Co., Ltd.