「小型デスクトップPCを4台組み合わせてAIクラスタを構築する」という試みの結果は?

ハードウェア

大規模なAIモデルを高速に実行するには、大容量のメモリや高性能なプロセッサが必要となります。テクノロジー系YouTuberのジェフ・ギアリング氏はAMDの「Ryzen AI Max+ 395」を搭載したマシンを4台組み合わせてクラスタを構成して、AIを快適に処理できるのか確かめた結果を公開しました。

I clustered four Framework Mainboards to test huge LLMs | Jeff Geerling

https://www.jeffgeerling.com/blog/2025/i-clustered-four-framework-mainboards-test-huge-llms

Benchmark Framework Desktop Mainboard and 4-node cluster · Issue #21 · geerlingguy/ollama-benchmark

https://github.com/geerlingguy/ollama-benchmark/issues/21 ギアリング氏はハードウェアメーカーのFrameworkの強力を得て、開発中の「Framework Desktop」のパーツを入手し、クラスタを構築しました。Framework DesktopはRyzen AI Maxシリーズを搭載したPCで、小型かつ高性能であることを特徴としています。

自分でパーツを選んで組み立てられるノートPC「Framework Laptop 13」がRyzen AI 300シリーズに対応&Framework初の小型デスクトップPCや12インチノートPCも登場 - GIGAZINE

ギアリング氏はFramework Desktopのメインボードと電源とファンを入手し、組み立てました。搭載しているプロセッサは最上位モデルのRyzen AI Max+ 395で、RAM容量は128GBです。

同じ構成のマシンを4台用意。

組み立てたマシンを「GeeekPi 8U」というラックマウントに取り付けて、クラスタを構成しました。これでRAM容量512GBの1台のマシンとして動作させられます。

完成したクラスタはかなり小型で、大きいラックの中にそのままスッポリ納まるサイズです。

クラスタ向けに開発されたベンチマーク「Top500 Benchmark」のテスト結果は以下の通り。Framework Desktop1台の処理性能は0.31TFLOPSでM4 Max搭載Mac Studioよりも低い性能でしたが、4台構成では処理性能が1.18TFLOPSに向上しました。

しかし、実際のAI処理では正常に動作しない問題が発生することが多く、ベンチマーク結果から想像するような性能向上は見られなかったとのこと。ギアリング氏は「マシン間のネットワークアクセスがメモリと比べて遅すぎる」「各種ツールの対応が遅れている」といった原因で性能を発揮できなかったと指摘しています。 以下のグラフは「Framework Desktop(4台構成)」「AmpereOne 192コア」「M3 Ultra搭載Mac Studio」「M4 Pro搭載 Mac mini(8台構成)」のコスト(棒グラフ)と秒間処理トークン数(折れ線グラフ)をまとめたものです。Framework Desktopは価格に応じた性能を発揮できておらず、M3 Ultra搭載Mac Studioのコストパフォーマンスが際立っています。

詳細なベンチマーク結果は以下のリンク先で確認できます。

Benchmark Framework Desktop Mainboard and 4-node cluster · Issue #21 · geerlingguy/ollama-benchmark

https://github.com/geerlingguy/ollama-benchmark/issues/21

・関連記事 スマホやPCなど家の中の計算資源をかき集めて自分用AIクラスターを構築できる「exo」 - GIGAZINE

MetaはテントにGPUクラスタを詰め込んでAIデータセンターの工期を短縮している - GIGAZINE

750円のマイクロコントローラーでスーパーコンピューターを作る方法 - GIGAZINE

OpenAIのオープンウェイトモデル「gpt-oss」はOllamaを使って個人用PCで簡単に使用可能 - GIGAZINE

関連記事: