資料の紹介

 人工知能(AI)、特に大規模言語モデル(LLM)の進化はすさまじく、モデルサイズは増大の一途をたどっている。一方、多くのAI開発現場では、GPUのメモリー上限のせいで性能が頭打ちになってしまうメモリー・ボトルネックが常態化しており、これがAI開発・運用の効率を低下させると同時に、技術的挑戦の足かせとなっている。

 AI活用は、既存の巨大モデルを使う時代から、複数のAIエージェントを組み合わせたマルチエージェントシステムを使いこなす時代へと移りつつある。今後、自社のニーズに合わせた小・中規模モデルを作ってチューニングし、AIエージェントとして利用するアプローチが重要になり、より高性能なAIインフラへの需要がますます高まると予想される。

 本資料では、データセンター向けGPU「NVIDIA B200」を用いたAI処理に対し、パフォーマンスチューニングを実施した結果について詳しく解説する。「B200」1台の費用対効果を前世代GPU「H100」2台と比較したところ、LLM事前学習で約4倍、巨大モデル推論で約1.3倍を達成したという。併せて、同チューニングを施したAI環境をすぐに利用できるクラウドサービスも紹介する。

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。