BLOG

AI に最適な DRAM の選択

最終更新日:

  このページはDeepLによって自動的に翻訳されました。 Switch to English

AI ワークロードの要求が厳しくなるにつれ、パフォーマンス向上のために適切な DRAM 構成を選択することが極めて重要になっています。その際、スピードと容量のどちらを優先すべきでしょうか?この記事では、5 種類の DRAM キットをゲーミング/AI PC 上で評価し、最適な DRAM 構成を探ります。

さまざまな DRAM セットアップを Ollama ツールを使用してテストし、3 つの大規模言語モデル (LLM) で 1 秒あたりのトークン数とメモリー使用量を測定します。

テストセットアップ

テストプラットフォームは、次のコンポーネントで構成されています。

AI モデル

メモリー要求とサイズが異なる 3 つの LLM(大規模言語モデル)を評価しました。

  • Llama 3.2 (3B) - ほとんどの AI PC に適した軽量モデル。
  • Llama 3.1 (8B) - スピードと容量の両方を兼ね備えたミッドレンジモデル。
  • DeepSeek-R1 (70B) - DRAM の限界を押し広げる大型モデル。

ベンチマーク手法

異なるモデルのロードには Ollama ユーティリティを使用しました。Ollama は、推論速度の測定に 1 秒あたりのトークン数スコアを使用します。また、異なる DRAM 構成で各モデルがどのように処理されるかを判断するため、メモリー使用量を追跡しました。テストしたプロンプトは以下のとおりです。

  • 「DDR4 メモリーと比較した DDR5 の利点は何ですか?」
  • 「人間と機械が共存する世界における AI 革命について短編小説を書いてください。」
  • 「ニューラルネットワークの概念とそのトレーニング方法をわかりやすく説明してください。」
  • 「強化学習の概念と、その教師あり学習との違いを、例を挙げて説明してください。」

最後に、ファイナルファンタジー XIV Dawntrail ベンチマークをテストし、各 DRAM 構成のゲーミングパフォーマンスを測定しました。この目的は、パフォーマンスを損なうことなく、AI タスクとゲームを同時に処理できる DRAM 構成を見つけることです。

結果と分析

dd2dcdb7-3e61-4cdf-8de9-58c9a6e10923

図 1:異なる LLM で CPU のみを使用してテストした各 DRAM 構成の 1 秒あたりのトークン数。

7880e64e-2639-4fec-a5ba-493f2957a2b6

図 2:LLM を RTX 4090 で実行した場合の DRAM 構成のパフォーマンス (1 秒あたりのトークン数)。

b4aa9215-4486-4ce7-9928-2da5e50e33e8

図 3:各 LLM を CPU のみで実行した場合と、CPU と GPU で実行した場合のシステムメモリー使用量をギガバイト (GB) で測定(概算値)。

a2844437-6d97-4179-8d2d-4b58dde4b14d

テストした各 DRAM 構成の FFXIV Dawntrail ベンチマーク。

これらの結果から、重要なことがいくつかわかります。

CPU のみを使用した場合、DeepSeek-R1 (70B) モデルは 32GB と 48GB の構成では処理できませんでした。RTX 4090 を使用した場合でも、32GB の DRAM では 70B モデルを動作させるには限界に近い状態です。

最高速 8400MT/s の、CUDIMM キットはゲーミングにおいて他のどの DRAM 構成よりも優れていますが、大型の AI モデルは RTX 4090 で実行しても、使用可能なメモリーはそれほど残っていません。

AI に最適な DRAM キット

  • AI ワークロードのみ:LLM を GPU なしで実行することはほぼないと考えられるため、最低でも 64GB DRAM キットが望ましいでしょう。さらに大型の LLM を使用する可能性を考慮すると、96GB DRAM キットが理想的です。
  • ゲーム + AI:8400MT/s が明らかに優れています。64GB DRAM キットもゲーミングにおいてはそれほど劣っていませんが、RTX 4090 にはシステムメモリーに余裕があるため、これが適しています。

まとめ

AI を多用するワークロードでは、特に大型モデルにおいて、DRAM 容量が重要な役割を果たします。ただし、ゲーミングと AI の両方を制御するハイブリッドシステムでは、速度とレイテンシーを最適化することも重要です。LLM がさまざまなハードウェア向けに継続的に最適化され、必要なリソースが抑えられるようになってきているとはいえ、より正確な結果を得るためには、より大型のモデルを動作させられるよう余分なメモリー容量を備えておくのが望ましいでしょう。

以上の点を考慮すると、最適な DRAM キットは CMH96GX5M2B7000C40 です。

記事内の製品