パフォーマンスエンジニアリング技術のリーディングカンパニーであるフィックススターズ株式会社は、同社のパフォーマンスエンジニアリングプラットフォーム「Fixstars AI Booster」(以下「AI Booster」)について、最新のGPUを搭載したサーバー上で動作試験を実施したことをお知らせいたします。 – NVIDIA H200 SXM 141GB(以下「H200」)– を搭載したサーバー上で、サクラインターネット株式会社のベアメタルGPUクラウドサービス「High Power PHY」において、当社のパフォーマンスエンジニアリングプラットフォーム「Fixstars AI Booster」(以下「AI Booster」)の運用テストを実施し、前モデル(H100)と比較して2.5倍の速度向上を達成したことをお知らせいたします。.
AIブースターによる「高出力PHY」の性能を最大限に引き出す
AI Boosterは、GPUなどのコンピューティングリソースの利用効率を最適化することで、常に高いパフォーマンスを維持することを目的としたソフトウェアです。パフォーマンスの観測と改善のサイクルをサポートする2つの機能、PO(Performance Observability)とPI(Performance Intelligence)を提供します。
フィックスターズ協力 さくらインターネット, は、AI Boosterのパフォーマンス監視および改善機能が、同社の生成AI向け「High Power」クラウドサービスの一環として新たに提供されたH200アーキテクチャのGPU上で効果的に機能することを確認しました。これは、ベアメタルシリーズ「High Power PHY」の第一弾となるものです。これにより、処理速度が向上します。.
こちらもお読みください: NTTグループとゲットワークス、AIを活用したICTプラットフォームで提携
Fixstars AI BoosterとH200のパフォーマンステスト結果
大規模な生成AIモデルを処理する場合、特に学習時にGPUのメモリ不足の問題がしばしば発生することが知られています。例えば、前モデルのH100では、70Bクラスのモデルの事前学習を2ノードで実行するために、メモリ消費を抑えるために処理速度や精度を落とす必要がありました。
動作確認内容
学習方法 事前学習
適用モデルラマ3.1 70B
トレーニングデータ RedPajama-Data-1T arXiv
使用フレームワークメガトロン-LM
AI BoosterによるH200事前学習高速化対策の概要
高精度オプティマイザの使用(SGD-SaI -> Adam)
高速演算ユニットの使用(fp16->fp8)
再計算量の削減(再計算-粒度フル→選択的など)
ソース PRタイムズ
