This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Zhenxu Tian, Yi Su, Juntao Li, Min Zhang

Articles by Zhenxu Tian, Yi Su, Juntao Li, Min Zhang

Academic · 1 min

Where Matters More Than What: Decoding-aligned KV Cache Compression via Position-aware Pseudo Queries

arXiv:2603.11564v1 Announce Type: new Abstract: The Key-Value (KV) cache is crucial for efficient Large Language Models (LLMs) inference, but excessively long contexts drastically increase KV …

37 views Mar 13

Zhenxu Tian, Yi Su, Juntao Li, Min Zhang

Articles by Zhenxu Tian, Yi Su, Juntao Li, Min Zhang

Where Matters More Than What: Decoding-aligned KV Cache Compression via Position-aware Pseudo Queries

JCG, PC

HSOLLC Co., Ltd.