Quantization (Niceleme)

Model ağırlıklarını daha düşük hassasiyete dönüştürerek sıkıştırma.

Neden Önemli?

Bellek ve hız optimizasyonu için kullanılan, yerel AI'ı mümkün kılan teknik.