「剪」出最有效率的神經網路

剪枝(pruning)是一種常見的技巧,藉由去除神經網路中冗餘的參數,使得運算速度快上數倍,並降低對資料儲存量的需求,同時保持瘦身後模型的準確度與原模型相當。在某些情況下,剪枝後的模型在重新訓練後,甚至能超越原本的模型。這在有速度要求(例如高幀數的即時物件辨識)或有硬體條件限制(例如在手機上運行模型)的情境中很有幫助,最新的研究讓我們更了解剪枝的意義與價值。

Read more