Über GPTQ
GPTQ ist 4-bit Quantization für LLMs. Es macht Modelle kleiner ohne viel Qualitätsverlust. GPTQ ist Open Source. Es macht LLMs kompakt.
Hauptfeatures
- Quantization
- 4-bit
- Open Source
- LLMs
GPTQ ist 4-bit Quantization für LLMs. Es macht Modelle kleiner ohne viel Qualitätsverlust. GPTQ ist Open Source. Es macht LLMs kompakt.