ChatGPT のようなモデルを中心とした AI アプリケーションの急速な台頭により、コンピューティング能力の需要が急増しています。 AI 時代の計算需要の増大に対応するため、清華大学グループ傘下の H3C グループは最近、2023 NAVIGATE Leader Summit で H3C UniServer G6 および HPE Gen11 シリーズの 11 個の新製品を発表しました。これらの新しいサーバー製品は、さまざまなシナリオにわたる AI の包括的なマトリックスを作成し、大量のデータとモデル アルゴリズムを処理するための強力な基盤プラットフォームを提供し、AI コンピューティング リソースの十分な供給を確保します。
多様な AI コンピューティングのニーズに対応する多様な製品マトリックス
インテリジェント コンピューティングのリーダーとして、H3C グループは長年にわたって AI の分野に深く関わってきました。 2022 年、H3C は中国のアクセラレーテッド コンピューティング市場で最高の成長率を達成し、国際的に有名な AI ベンチマーク MLPerf で合計 132 の世界第 1 位のランキングを獲得し、その強力な技術的専門知識と能力を実証しました。
H3C は、インテリジェント コンピューティングの基盤に構築された高度なコンピューティング アーキテクチャとインテリジェント コンピューティング電力管理機能を活用して、大規模モデルのトレーニング用に特別に設計されたインテリジェント コンピューティングのフラッグシップ H3C UniServer R5500 G6 を開発しました。また、大規模な推論/トレーニング シナリオに適したハイブリッド コンピューティング エンジンである H3C UniServer R5300 G6 も導入しました。これらの製品は、さまざまな AI シナリオにおける多様なコンピューティング要件をさらに満たし、包括的な AI コンピューティングをカバーします。
大規模モデルトレーニング用に設計されたインテリジェント コンピューティングのフラッグシップ
H3C UniServer R5500 G6 は、強度、低消費電力、インテリジェンスを兼ね備えています。前世代と比較して、3 倍の計算能力を提供し、GPT-4 大規模モデル トレーニング シナリオのトレーニング時間を 70% 削減します。大規模学習、音声認識、画像分類、機械翻訳など、さまざまなAIビジネスシーンに適用可能です。
強み: R5500 G6 は最大 96 個の CPU コアをサポートし、コア パフォーマンスが 150% 向上します。新しい NVIDIA HGX H800 8-GPU モジュールが搭載されており、32 PFLOPS の計算能力を提供し、大規模モデル AI トレーニング速度が 9 倍、大規模モデル AI 推論パフォーマンスが 30 倍向上しました。さらに、PCIe 5.0 および 400G ネットワーキングのサポートにより、ユーザーはより高性能な AI コンピューティング クラスターを展開でき、企業での AI の導入と応用を加速できます。
インテリジェンス: R5500 G6 は 2 つのトポロジ構成をサポートし、さまざまな AI アプリケーション シナリオにインテリジェントに適応し、ディープ ラーニングおよび科学技術コンピューティング アプリケーションを高速化し、GPU リソースの使用率を大幅に向上させます。 H800 モジュールのマルチインスタンス GPU 機能のおかげで、単一の H800 を 7 つの GPU インスタンスに分割でき、最大 56 の GPU インスタンスが可能で、それぞれが独立したコンピューティング リソースとメモリ リソースを持ちます。これにより、AI リソースの柔軟性が大幅に向上します。
低炭素フットプリント: R5500 G6 は、CPU と GPU の両方の液体冷却を含む液体冷却を完全にサポートします。 1.1 未満の PUE (電力使用効率) により、計算量の急増の中でも「クール コンピューティング」が可能になります。
R5500 G6 は、リリース時に「2023 年の計算パフォーマンスのパワー ランキング」で「2023 年の優れた高性能サーバー トップ 10」の 1 つとして認められたことは注目に値します。
トレーニングと推論の需要を柔軟にマッチングするハイブリッド コンピューティング エンジン
H3C UniServer R5300 G6 は、次世代 AI サーバーとして、前世代と比較して CPU と GPU の仕様が大幅に向上しています。優れたパフォーマンス、インテリジェントなトポロジー、統合されたコンピューティングおよびストレージ機能を誇り、ディープラーニング モデルのトレーニング、ディープラーニング推論、その他の AI アプリケーション シナリオに適しており、トレーニングと推論コンピューティングのニーズに柔軟に対応します。
卓越したパフォーマンス: R5300 G6 は、最新世代の NVIDIA エンタープライズ グレード GPU と互換性があり、前世代と比較して 4.85 倍のパフォーマンス向上を実現します。 GPU、DPU、NPU などのさまざまなタイプの AI アクセラレーション カードをサポートし、さまざまなシナリオで AI の異種コンピューティング能力要件を満たし、インテリジェンスの時代を強化します。
インテリジェント トポロジ: R5300 G6 は、HPC、パラレル AI、シリアル AI、4 カード ダイレクト アクセス、8 カード ダイレクト アクセスを含む 5 つの GPU トポロジ設定を提供します。この前例のない柔軟性により、さまざまなユーザー アプリケーション シナリオへの適応性が大幅に向上し、リソースがインテリジェントに割り当てられ、効率的なコンピューティング能力の運用が促進されます。
統合されたコンピューティングとストレージ: R5300 G6 は、AI アクセラレーション カードとインテリジェント NIC に柔軟に対応し、トレーニングと推論機能を組み合わせます。最大 10 個の倍幅 GPU と 24 個の LFF (ラージ フォーム ファクター) ハード ドライブ スロットをサポートし、単一サーバー上でのトレーニングと推論の同時実行を可能にし、開発およびテスト環境にコスト効率の高いコンピューティング エンジンを提供します。最大 400 TB のストレージ容量を備え、AI データのストレージ容量要件を完全に満たします。
AI ブームの高まりに伴い、コンピューティング能力は常に再形成され、課題が生じています。次世代 AI サーバーのリリースは、H3C グループの「固有のインテリジェンス」テクノロジーへの取り組みと、インテリジェント コンピューティングの進化への継続的な推進における新たなマイルストーンとなります。
H3C グループは、「クラウドネイティブ インテリジェンス」戦略に導かれ、未来に向けて「綿密な実用主義、時代にインテリジェンスを与える」というコンセプトを堅持しています。彼らは今後もインテリジェント コンピューティングの肥沃な土壌を耕し、深いレベルの AI アプリケーション シナリオを探求し、将来に対応した適応可能なコンピューティング能力を備えたインテリジェントな世界の到来を加速していきます。
投稿時間: 2023 年 7 月 4 日