This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Yixuan Wang, Shiyu Ji, Yijun Liu, Qingfu Zhu, Wanxiang Che

Articles by Yixuan Wang, Shiyu Ji, Yijun Liu, Qingfu Zhu, Wanxiang Che

Academic · 1 min

EchoKV: Efficient KV Cache Compression via Similarity-Based Reconstruction

arXiv:2603.22910v1 Announce Type: new Abstract: The increasing memory demand of the Key-Value (KV) cache poses a significant bottleneck for Large Language Models (LLMs) in long-context …

3 views Mar 25

Yixuan Wang, Shiyu Ji, Yijun Liu, Qingfu Zhu, Wanxiang Che

Articles by Yixuan Wang, Shiyu Ji, Yijun Liu, Qingfu Zhu, Wanxiang Che

EchoKV: Efficient KV Cache Compression via Similarity-Based Reconstruction

JCG, PC

HSOLLC Co., Ltd.