Quantization of Deep Learning Solution for Efficient Interference
Kim Hee, Big Data BBQ 2021
Der Stromverbrauch von Rechenzentren verdoppelt sich jedes Jahr, und Edge-Geräte wie das Internet der Dinge (IoT) nehmen rapide zu. Die Quantisierung von Deep-Learning-Modellen reduziert die Modellgröße und die Inferenzzeit bei geringem bis gar keinem Verlust der Modellgenauigkeit. In der Präsentation werden der Hintergrund der Kernkonzepte und einige Ergebnisse vorgestellt.