ソニー、AIの学習で世界最高速を達成 従来の約半分と驚異的

2018年11月14日 20:13

 ソニーは13日、ディープラーニングの開発用フレームワークである「NNL:Neural Network Libraries」と産業技術総合研究所(産総研)が構築・運用する「AI橋渡しクラウド(ABCI)」を活用して、ディープラーニングの学習速度において世界最高速を達成したと発表した。

【こちらも】ソニーのAI統合開発環境 クラウドでの高速学習サービスを開始

 AI分野で最も実用化が進んでいる技術が、ディープラーニング(深層学習)だ。2012年、物体の認識率を競うILSVRCベンチマークにて、従来の手法よりも10%も高い認識率83%を達成したのがディープラーニングである。学会での成果発表から僅か6年。ディープラーニングは自動運転や創薬開発など着実に実用化される一方、ヒト型ロボットなど新たな市場形成に向け更なる進化を遂げている。

 新たな市場は、ディープラーニング開発環境にも及ぶ。

 例えば、ソニーは2017年8月17日、ディープラーニングのプログラムを生成できる統合開発環境「NNC:Neural Network Console」と「NNL」の無償提供を発表。企業や大学の研究開発部門での開発環境を無償提供する一方、その成果の実用化段階で新たな価値を生む。

 他方、富士通は2018年6月26日、産総研へ納品した大規模AIクラウド計算システム「ABCI」がスパコンランキングTOP500で世界5位、国内で1位を獲得したと発表。産総研は8月からの本格稼働を目指していた。ディープラーニングの課題は、AI開発時の学習プロセスとAI実装時の推論プロセスの双方の時間短縮だ。この発表は、AIの新規開発における日本の優位性を示すものだ。

 今回の発表は、ソニーのAI開発用フレームワーク「NNL」と産総研のAIクラウド「ABCI」を組み合わせ、AIの学習プロセスの速度で世界最高速を達成したことであり、最先端のAI技術の市場への投入を飛躍的に改善する。AI創出スピードでの大きな武器だ。

●世界最高の学習速度3.7分は、従来の約半分

 AI開発では試行錯誤を繰り返す必要がある。そのため、この学習時間を短縮させることが重要であるが、複数のGPU(Graphics Processing Unit)を用いた分散学習が有力な手段だ。

 分散学習における理想は、各GPUの負荷分散を均一にすることと各GPU間のオーバーヘッドを最小化することだ。今回、学習の進行状況に応じて最適なバッチサイズを変えることにより負荷分散を均一化。加えて、ABCIのシステム構成に適したデータ同期技術によりGPU間の通信を高速化しオーバーヘッドを最小化した。

 業界で一般的にベンチマークとして活用されているImageNet/ ResNet-50の学習を約3.7分(最大2176基のGPU利用)で完了。従来の最高速度6.6分を大幅に上回る結果だ。認識精度も75.03%と従来の75.8%と同等である。驚異的なことは、GPUのスケーリング効果が91.62%もあることだ。単純なオーバーヘッド解消以外のノウハウを含んでいる。

 研究成果は「ImageNet/ResNet-50 Training in 224 Seconds(PDF)」で公開している。(記事:小池豊・記事一覧を見る

関連記事

最新記事