【AI】エッジAIのためのDNNモデル圧縮自動化技術
和歌山大学 システム工学部 システム工学科 教授 和田 俊和 講師 菅間 幸司
概要
学習済み深層ニューラルネットワークモデル(以下、DNNモデル)の圧縮を自動化するための技術です。
次の4つの要素技術から構成されます。
1)冗長なニューロンを定して削除し、その働きを別のニューロンに代替させる技術
2)DNNモデルの層ごとの圧縮率を最適化して精度低下を抑える技術
3)より効果的な圧縮のため、ResNetのような分岐を持つDNNモデルを直列化する技術
4)DNNモデルのアーキテクチャを解析し、直列化および圧縮の対象となる部分を探し出す技術
活用事例
本技術の活用法の一例として、転移学習との組み合わせによるエッジAI開発の効率化が挙げられます。新たなDNNモデルを開発する際に、別の大規模データセットで事前学習を済ませたDNNモデルに対して転移学習を行い、さらに本技術を用いて圧縮を行うことで、高精度かつコンパクトなモデルを作ることができます。これは、事前学習済みモデルを利用しないスクラッチ学習よりも、はるかに少ない時間・コストで実行できます。
お問い合わせ
産学連携イノベーションセンター URA室
メールアドレス liaison@ml.wakayama-u.ac.jp
電話番号 073-457-7564 FAX 073-457-7550
URL https://www.wakayama-u.ac.jp/cijr/