arxiv.org · Jun 3, 2026 04:00 UTC

[2606.02823] Qift: Shift-Friendly No-Zero W2 Post-Training Quantization for Rotated W2A4/KV4 LLM Inference

Summary

Abstract page for arXiv paper 2606.02823: Qift: Shift-Friendly No-Zero W2 Post-Training Quantization for Rotated W2A4/KV4 LLM Inference

Original reporting