HOW TO

ローカルAIに最適なPC構成(初心者向け/中級者向け/上級者向け)

最終更新日:

  このページはDeepLによって自動的に翻訳されました。 Switch to English

ローカルAI用のPCを組むのは、ゲーミング用を組むのとは異なります。クロック速度よりもVRAMやメモリ帯域幅が重要になります。RGB照明よりもRAMの容量が重要です。また、ストレージは1つあたり数十ギガバイトにも及ぶモデルを扱える必要があります。ここでは、3つの価格帯ごとに実際に重要なポイントと、それぞれの構成で現実的に動作させられる内容について解説します。

ローカルAIに適したPCとはどのようなものか?

パーツを選ぶ前に、現地のAI推論がハードウェアに実際に何を求めているのかを知っておくと役立ちます:

  • GPUのVRAM:これが最も重要な要素です。VRAMの容量が大きければ大きいほど、GPU上で完全に処理できるモデルの規模も大きくなり、そこで最高の処理速度が得られます。
  • システムRAM:モデルがVRAMに収まらない場合、システムRAMに読み込まれます。RAMの容量が大きければ、より大規模なモデルも実行できますが、処理速度は低下します。
  • メモリ帯域幅:メモリとプロセッサ間のデータ転送速度は、トークン生成速度に直接影響します。GPUのメモリ帯域幅は、通常、システムRAMの10~20倍高速です。
  • ストレージ:モデルのサイズは1つあたり4~50GB以上になる場合があります。モデルの読み込みに時間がかかりすぎないよう、高速なストレージ(NVMe SSD)を用意することをお勧めします。
  • CPU:推論処理においては、想像するほど重要ではありませんが、高性能な最新CPUであれば、システム全体をスムーズに動作させ、CPUのみでのフォールバック処理も適切にこなせます。

初心者向けプラン:まずは気軽に始めてみよう

これは、システム全体を再構築することなく、ローカルAIを試してみたいという方に向けたものです。パラメータ数30億~70億の小型モデルを実行しており、頻繁なクラッシュやスワッピングに悩まされることなく、実際に動作させたいと考えている方に向けたものです。

目指すべきこと

  • GPU:8GB VRAM(例:RTX 5060 または同等品)
  • RAM:16~32GB DDR4/DDR5
  • ストレージ:500GB~1TB NVMe SSD
  • CPU:最新の6コア以上(例:Intel Core Ultra 5 235、AMD Ryzen 5 9600X)
  • 電源ユニット:550~650W、80+ Bronze 以上

実行できるもの

量子化された7Bモデル(Llama 3 8B Q4など)は、8GBのVRAMに余裕を持って収まり、実用的な速度でトークンを生成します。チャットや文書の要約、基本的なコード支援などが可能です。さらに小型の3Bモデルでも、レスポンスが軽快に感じられるでしょう。

7Bを超えると限界に達し、モデルが処理の一部をCPUやRAMにオフロードするため、動作が著しく遅くなります。しかし、ツール(LM Studio、Ollama)を使い始めたり、習得したりするには、このプランで十分です。

corsair vengeance a7400 pre built gaming PC

中堅クラス:本格的なローカルAI

ここで初めて、ローカルAIが実際の業務において真に役立つものだと実感できるでしょう。130億パラメータのモデルをGPU上で完全に実行でき、より長いコンテキストウィンドウを処理でき、システム全体が重くなることなくマルチタスクをこなすことができます。

目指すべきこと

  • GPU:12~16GBのVRAM(例:RTX 5070 Ti または同等品)
  • RAM:32~64GB DDR5
  • ストレージ:1~2TB NVMe SSD
  • CPU:最新の8コア以上(例:Intel Core Ultra 7 265K、AMD Ryzen 7 9700X)
  • 電源ユニット:750W 80+ Gold
Vengeance_a7300_11_import

実行できるもの

Quantized 13Bモデルは、VRAMだけで余裕を持って動作します。7Bモデルと比べて、出力品質が明らかに向上し、応答の一貫性が高まり、推論能力も向上し、指示への従順性も高まります。

70Bモデルは、部分的なオフロード(一部のレイヤーをGPUに、残りをRAMに配置)を行うことで実行可能になりますが、処理速度は低下します。より大規模なモデルを試してみたい場合は、64GB RAMオプションを選ぶ価値があります。

この階層は、執筆支援、コーディング、文書分析、および複数の小規模なモデルを並行して実行するなど、実用的なローカルAIタスクの大部分を処理します。

愛好家向け:一切の妥協なし

これは、利用可能な最大規模のオープンモデルを高速で実行し、大規模なコンテキストウィンドウや複雑なワークフローにも対応したい方に向けたものです。700億以上のパラメータを持つモデルをスムーズに実行したり、複数のモデルを同時に読み込んだりすることを想定しています。

目指すべきこと

  • GPU:24GB以上のVRAM(例:RTX 3090、RTX 4090、RTX 5090)または、お使いのツールが対応している場合はデュアルGPU
  • RAM:64~128GB DDR5
  • ストレージ:2~4TBのNVMe SSD(モデル専用のドライブを検討してください)
  • CPU:最新の16~24コア(例:Intel Core Ultra 9 285K、AMD Ryzen 9 9950X3D)
  • 電源ユニット:1000W以上、80+ Gold または Platinum

実行できるもの

量子化された700億パラメータのモデルは、量子化レベルによっては、24GBのVRAMに完全に(あるいはほぼ完全に)収まります。ここで得られる出力品質はクラウドAPIに匹敵するものであり、130億パラメータのモデルと700億パラメータのモデルとの間には大きな差があります。

128GBのシステムRAMをバックアップとして活用することで、最も大規模なオープンモデルであっても、部分的なオフロードによってアクセス可能になります。また、高速なNVMeストレージにより、モデルの読み込みや切り替えは数分ではなく、わずか数秒で完了します。

このレベルになれば、単にAIをローカルで実行するだけでなく、クラウドAPIを一切利用しなくても済むほど、十分に高いレベルで運用できるようになります。

geforce-rtx-5090

これらを見逃さないでください

人々が思っている以上に重要なことがいくつかあります:

冷却:

  • AI推論の負荷が継続すると、GPUは高温になります。通気性の良いケースを使用すると、その効果は歴然です。詳細は後述します。
  • CPUに関しては、高品質なCPUクーラーがあればシステム全体を安定させることができます。例えば、CORSAIR iCUE LINK TITAN RX RGB 360mmのような製品なら、長時間の高負荷動作にも十分対応できます。

電源:

  • 十分な余裕のある信頼性の高い電源ユニット(PSU)を選べば、高負荷な推論処理中のシステムクラッシュを防ぐことができます。ここだけはケチらないようにしましょう。CORSAIR RMx RM1000xは、ほとんどのシステム構成に適した万能モデルです。一方、消費電力の大きいエンスージアスト向けシステムを構築する場合は、HX1500iが最適です。

ケース内の気流:

  • システムは長時間にわたり高負荷で稼働することになるため、長寿命を維持するには十分な通気性が重要です。CORSAIR FRAME 4000Dなら、ミッドタワーケースでありながら確かな通気性を確保できます。より大型のラジエーターやストレージスペースが必要な場合は、FRAME 5000Dへのアップグレードも検討してください。

保存速度:

  • HDDとNVMe SSDで30GBのモデルを読み込む場合、その差は1分と数秒ほどになります。さまざまなモデルを頻繁に試しているなら、高速なストレージは大幅な時間の節約になります。CORSAIR MP700 PROはGen5の速度を実現し、最速のモデル読み込みを可能にします。また、MP600 ELITEは手頃な価格で優れたGen4性能を発揮する選択肢です。
RMx_SERIES_2021_RM1000x_Artboard01_AA
MP700 PRO
corsair frame 5000d (1)

CORSAIR VENGEANCE 完成品

パーツリストを飛ばして、すぐにモデルを動かしてみたいという方には、CORSAIR VENGEANCEゲーミングPCがおすすめです。必要なハードウェアがすべて組み立て済みで、動作確認も済んでおり、2年間の保証も付いています。ゲーミング向けに設計されていますが、特にVRAMとDDR5メモリを豊富に搭載した上位モデルは、ローカルAIの動作にも十分なスペックを備えています。

現在のVENGEANCEのラインナップの一部を、本ガイドのティアに当てはめると以下のようになります:

スターター相当:

中程度相当:

  • Ryzen 7 9800X3D、RTX 5070 Ti、32GB DDR5を搭載したVENGEANCE a7500は、まさに絶妙なバランスを実現しています。 RTX 5070 Tiは16GBのVRAMを搭載しており、130億ポリゴンのモデルをGPUのみで完全に処理するのに十分な容量です。また、9800X3Dは現在入手可能なコンシューマー向けCPUの中でも最高峰の一つであるため、CPUへのフォールバック時のパフォーマンスも非常に優れています。

愛好家向け:

すべてのVENGEANCEシステムには、NVMeストレージとCORSAIR製水冷クーラーが搭載されており、米国で組み立てられています。互換性を気にすることなく、保証付きの完成品を手に入れることができます。ランナーアプリをインストールし、モデルをダウンロードするだけで、すぐに走り出すことができます。

CORSAIR_VENGEANCE_a7500_AIR_RENDER_01

CORSAIR AI300

専用のAIワークステーションをお探しなら、「CORSAIR AI Workstation 300(AI300)」がおすすめです。これは、ローカルAI処理を目的に一から設計された、コンパクトで専用仕様のワークステーションです。

corsair-ai-workstation-300

AI推論に最適化された大容量メモリ構成、大規模モデルに対応するグラフィックスメモリ、そしてCORSAIR AIソフトウェアスタックが標準搭載されているため、設定に週末を費やすことなく、箱から出してすぐにモデルの実行を開始できます。

記事内の製品

JOIN OUR OFFICIAL CORSAIR COMMUNITIES

Join our official CORSAIR Communities! Whether you're new or old to PC Building, have questions about our products, or want to chat about the latest PC, tech, and gaming trends, our community is the place for you.