ローレンス・リバモア国立研究所がセレブラスの世界最大コンピュータチップと「ラッセン」スーパーコンピュータを組み合わせAI研究を加速

プレスリリース発表元企業:Cerebras Systems

配信日時: 2020-08-21 23:40:00

ローレンス・リバモア国立研究所がセレブラスの世界最大コンピュータチップと「ラッセン」スーパーコンピュータを組み合わせAI研究を加速



(米カリフォルニア州リバモア)-(ビジネスワイヤ)-- ローレンス・リバモア国立研究所(略称LLNL)とAIコンピュータ企業のセレブラスシステムズは、世界最大のコンピュータチップを国家核安全保障局(略称NNSA)の「ラッセン」システムに統合し、最高峰のスーパーコンピュータを最先端AI技術でアップグレードしました。

技術者は先日、シリコンバレーに拠点を置く企業の巨大なWafer-Scale Engine(WSE)チップ - 1.2兆個のトランンジスタ搭載の機械学習/AIアプリケーション向けに特別設計 - を、23ペタフロップのラッセンと、さらにはWSEチップを格納するCS-1アクセラレータハードウエアシステムに接続する作業を完了させました。ラッセンはIBM/NVIDIAのSierraシステムに対する公開姉妹機で、現時点で世界最高性能スーパーコンピュータの最新Top 500リストで14位にランクされています。

セレブラスの機械学習システムとラッセンの世界クラスのシミュレーション機能の組み合わせに成功したことで、LLNLはAIプラットフォームを大規模なスーパーコンピュータと統合した最初の機関となります。この根本的に新しいタイプのコンピューティングソリューションの誕生により、研究者は予測的モデリングの新しいアプローチを研究できます。ユーザーはこのシステムを7月から利用しており、初期AIモデルの作成を開始しています。

研究者によると、NNSAの先進的シミュレーション・コンピューティング(ASC)プログラムの資金提供を受けている本プラットフォームは、アメリカ合衆国エネルギー省とNNSAの国家安全保障ミッションの極めて重要なアプリケーションに対するソリューションを、今後10年間で桁違いに発展させることを目指しています。国立点火施設で行われている核融合爆縮実験、材料科学、ATOM(Accelerating Therapeutic Opportunities in Medicine、医薬品開発機会の促進)プロジェクトによるCOVID-19およびがんの新しい処方薬の迅速なデザインすべてが、初期の応用例です。

ASCプログラムのディレクター代理のThuc Hoang氏は、次のように述べています。「ラッセンのような世界クラスのスーパーコンピュータにAIの要素が加わることで、当プログラムの科学者や物理学者は、業界がAIに行っている大規模な投資を活用し、当局シミュレーションの精度に加え、基幹的な問題を解決するエンドユーザーの生産性をいずれも向上させることができるようになります。セレブラスと協業して、この先駆的技術をNNSAが活用できるようにしていけることに感激しています。」

「世界最速のAIスーパーコンピュータ」と称されるCS-1システムは、AI向けに最適化された40万個のコア、18ギガバイトのオンチップメモリ、毎秒100ペタビットのオンチップネットワーク帯域幅から成りWSEチップ上で動作します。今回のアップグレードにより、LLNLは初めてAI専用ハードウエアを含む高性能コンピューティング(HPC)リソースを持つことになり、実質的に世界で初めて「認知シミュレーション(CogSim)」向けコンピュータシステムを開発したことになります。CogSimは、LLNLの科学者が従来のHPCシミュレーションとAIの組み合わせを表すために使用している用語です。

リバモア・コンピューティングの最高技術責任者(CTO)で、CS-1の調達業務を主導したBronis R. De Supinski氏は、次のように語っています。「ムーアの法則はまだ健在ですが、減速していることが分かります。ハードウエア改善の歴史的なペースは減速したか止まっていますが、コンピューティングの需要には当てはまりません。私たちは、ミッション要件に対応する能力を高め、増え続ける計算能力の要件に応えるための方法に、新しい答えを必要としています。認知シミュレーションは、能力を継続的かつ飛躍的に改善できるアプローチであると確信しており、Cerebras CS-1などの新規アーキテクチャーに基づいたシステムレベルの異種混在アプローチは、これらの改善を達成する上で重要な要素です。」

「CS-1とラッセンの組み合わせにより、LLNLは異種混在性を探究できる」と、De Supinski氏は述べています。ここでスーパーコンピュータは、それぞれが所定の作業に貢献する異なる専門性を備えたコンピュータ要素を含むことになります。研究者によると、これによりデータ生成やエラー訂正などの操作を同時に実行できるようになるため、科学的問題に取り組む上ではるかに統合的かつ効率的でコスト効率に優れたソリューションがもたらされとの事です。

LLNLのコンピュータ科学者であるIan Karlin氏は、次のように述べています。「異種混在システムを利用できるようになったため、アプリケーションのどこで同時に複数の作業を実行できるのかを見いだす動機づけになっています。私たちの認知シミュレーションワークロードの多くでは、機械学習部分をセレブラスのハードウエアで実行し、HPCシミュレーションの部分を引き続きGPUで実行して、解決までの時間を短縮していきます。」

Cerebras WSEプロセッサは、ディープラーニング向けに最適化されています。最大のグラフィックス・プロセッシング・ユニット(GPU)よりも56倍以上の大きさで、78倍多いコンピュートコアを搭載しています。18ギガバイトのオンチップメモリを持つWSEは、GPUと比べて、の3000倍のオンチップメモリと1万倍以上のメモリ帯域幅を備えています。WSEチップは、水冷機能と毎秒1.2テラビット以上のI/O帯域幅を持つCS-1システムにパッケージ化されています。このプラットフォームは、スーパーコンピュータの既存のメラノックス製InfiniBand通信ネットワークを介して、ラッセンに接続しています。

セレブラスシステムズの創設者で最高経営責任者(CEO)のアンドリュー・フェルドマンは、次のように述べています。「セレブラスはLLNLと提携して、スーパーコンピュータの限界を押し拡げることを誇りに思います。その業界を新たな未踏の領域に導くことは、すべての新興企業が思い描く夢です。CS-1は現存する最速のAIコンピュータですが、ラッセンと統合することで、世界で最も高速なスーパーコンピュータの1つとなり、新しい独自クラスのソリューションが生まれます。このAIとスーパーコンピュータを統合した強力なシステムは、スーパーコンピューティングの最高の処理能力を、AIに特化した最高の計算能力と組み合わせて、科学・技術の最も困難な課題の解決を狙ったワークフローを作成するものです。」

研究所のコンピュータ科学者らは、このシステムの能力により、ワークフローの不要な処理を省略して、ディープラーニングのニューラルネットワークを高速化できると述べています。LLNLのコンピュータ科学者で、研究所で大規模ニューラルネットワークの取り組みを率いるBrian Van Essen氏は、ウエハースケールの統合によって、ニューラルネットワークのトレーニングを拡張する際の通信の限界を最小限に抑えられるほか、研究者が問題をより小さなジョブに「細かく切り分ける」必要のある回数を最小限に減らすことができると述べています。

Van Essen氏は、次のように語っています。「科学的探究をより短時間の計算でこなしたり、科学的に不意確定な分野をより深く掘り下げたりと、より多くの計算時間を費やしながらですが、より良い答えを得ることができます。このシステムを、認知フレームワークでモニタリングすることで、当研究所の物理学者の効率を改善できます。エラーを見つけるために、シミュレーションを終始見守る代わりに、こうしたタイプのシステムが光を当てることができる科学的な疑問にもっと目を向け始めることができると期待しています。」

Van Essen氏が率いる研究チームは、CS-1システムで実行する2つのAIモデルを、LLNL研究所長の認知シミュレーションイニシアチブから選定しました。LLNLの研究者らによると、予備的研究では、国立点火施設(NIF)が実験で使用する核融合ターゲットを最適化するために、レーザー爆縮のシミュレーション画像を最大50億枚使用した学習に着眼し、核兵器備蓄性能維持アプリケーション向けに高エネルギー出力と強力な核融合爆縮を達成することを目指しています。

LLNLの物理学者で認知シミュレーション責任者のBrina Spears氏によれば、NIFの科学者らはCS-1を使用して、飛躍的に高速なAIベースの物理モデルをラッセンのシミュレーションコードに直接埋め込むため、短時間でより相当詳細な物理を実現できるようになります。さらに計算負荷が拡張されるため、科学者らは膨大な量のシミュレーションを超高精度の実験データと融合できると、Spears氏は述べています。

Spears氏は、次のように語っています。「CS-1が持つAIのパワーをラッセンの精密なシミュレーションと組み合わせることで、CogSimコンピュータが誕生し、国立点火施設で行う慣性閉じ込め核融合(ICF)実験の新たな扉が開かれます。これで何十億枚ものシミュレーション画像を、NIFの素晴らしいX線/中性子カメラの出力と組み合わせて、今後の核融合設計の予測を向上させることができます。そして、これがほんの手始めに過ぎないことはまず間違いなく、今後のAI高速化HPCプラットフォームが実現できることや、私たちがそれらに求めるようになることを、垣間見ているだけなのです。」

LLNLとセレブラスは統合を確実に成功させるために、今後数年間にわたり、人工知能卓越センター(AICoE)に参画し、認知シミュレーションが研究所のワークロードで動作できるようにするための最適パラメーターを決定します。その結果次第で、LLNLはラッセンとその他のスーパーコンピューティングプラットフォームの両方にCS-1システムを追加する可能性があります。

AICoEの取り組みを率いるVan Essen氏は、次のように述べています。「とても気持ちが高まっています。私たちがこの研究所にいるのは、この種の科学に取り組むためです。私はコンピュータアーキテクトとして訓練を受けているため、この種のシステムを構築し、このような規模で初めて導入する機会を得られるのは、本当に元気づけられます。ラッセンのようなシステムと統合して、連携させることで、この種のフレームワークを最初に探求できる真に独自の機会を手にできました。」

1952年に設立されたローレンス・リバモア国立研究所は、革新的な科学・工学・技術を通じて、米国の最も重要な国家安全保障上の課題にソリューションを提供しています。ローレンス・リバモア国立研究所は、ローレンス・リバモア・ナショナル・セキュリティーが米国エネルギー省の国家核安全保障局に代わって管理しています。

セレブラスシステムズについて

Cerebras Systemsは、先駆的なコンピュータキテクト、コンピュータ科学者、ディープラーニング研究者、あらゆるタイプのエンジニアからなるチームです。我々は、人工知能の作業を現在の技術水準を超えて3桁の速さで加速させる新しいクラスのコンピュータを構築するために結集しました。Cerebras CS-1は、現存する中で最速のAIコンピュータです。セレブラスCS-1には、業界初となるCerebras Wafer Scale Engine (WSE)などが搭載されています。WSEは、これまでに作られた中で最大のチップです。1.2兆個のトランジスタを含み、46,225平方ミリメートル以上のシリコンをカバーし、40万個のAIに最適化されたコンピュートコアを搭載しています。市場に出回っているグラフィックス・プロセッサは、540億個のトランジスタを持ち、826平方ミリメートルのシリコン上に、6,912個のコアを搭載するものが最大です。人工知能の作業において大規模なチップは、より迅速に情報を処理し、より短い時間で答えを出す事ができます。その結果、これまで数ヶ月かかっていたニューラルネットワークが、Cerebras WSEにより数分でトレーニングできるようになりました。

リンク:

https://www.cerebras.net/

https://computing.llnl.gov/computers/lassen

https://www.llnl.gov/news/llnl%E2%80%99s-lassen-supercomputer-leaps-no-10-top500-list-sierra-remains-no-2

本記者発表文の公式バージョンはオリジナル言語版です。翻訳言語版は、読者の便宜を図る目的で提供されたものであり、法的効力を持ちません。翻訳言語版を資料としてご利用になる際には、法的効力を有する唯一のバージョンであるオリジナル言語版と照らし合わせて頂くようお願い致します。



businesswire.comでソースバージョンを見る:https://www.businesswire.com/news/home/20200821005357/ja/

連絡先
LLNL MEDIA CONTACT:
Jeremy Thomas, 925-337-4976, thomas244@llnl.govCerebras Systems
Hiromasa Ebi (Hiromasa.ebi@cerebras.net)

プレスリリース情報提供元:ビジネスワイヤ