中国政府がDeepSeekの新AIモデル「DeepSeek-R2」をHuawei製チップで開発するよう求めたが失敗してリリースが遅れているとの報道

ハードウェア

by Tim Reckmann

中国のAIスタートアップであるDeepSeekは、2025年1月に少ない計算リソースで高いパフォーマンスを実現した推論モデル「DeepSeek-R1」をオープンソースでリリースし、大きな話題を集めました。ところが、新たなAIモデルである「DeepSeek-R2」のリリースは、中国政府がAIモデルの開発にHuawei製のチップを使うように要求したせいで遅れていると、経済紙のフィナンシャル・タイムズが報じています。

DeepSeek’s next AI model delayed by tech issues with Chinese chips

https://www.ft.com/content/eb984646-6320-4bfe-a78d-a1da2274b092

DeepSeek's launch of new AI model delayed by Huawei chip issues, FT reports | Reuters

https://www.reuters.com/world/china/deepseeks-launch-new-ai-model-delayed-by-huawei-chip-issues-ft-reports-2025-08-14/

DeepSeek reportedly urged by Chinese authorities to train new model on Huawei hardware — after multiple failures, R2 training to switch back to Nvidia hardware while Ascend GPUs handle inference | Tom's Hardware

https://www.tomshardware.com/tech-industry/artificial-intelligence/deepseek-reportedly-urged-by-chinese-authorities-to-train-new-model-on-huawei-hardware-after-multiple-failures-r2-training-to-switch-back-to-nvidia-hardware-while-ascend-gpus-handle-inference

DeepSeek-R1はトレーニングコストがOpenAIの推論モデル「o1」の約3%程度だといわれており、コストに対する理論的な利益率は1日あたり最大545%に達するとのこと。また、モデルデータが公開されているため、ユーザーがサーバーやローカル上で実行できるようになっている点も注目されています。

DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか - GIGAZINE

そんなDeepSeekの次世代モデルである「DeepSeek-R2」は2025年5月にリリースされると報じられていましたが、5月末から2カ月以上が経過した記事作成時点でも発表されていません。その理由についてフィナンシャル・タイムズは、中国政府の介入が原因だったと報じています。

一連の事情に詳しい3人の証言者によると、中国政府はDeepSeekがR1の学習に成功したことを受けて、従来のNVIDIA製ハードウェアではなくHuawei製のAIチップ「Ascend」ベースのプラットフォームを使うように促したとのこと。

DeepSeekは中国政府の指示を受け入れてR2の開発にHuawei製チップを導入しましたが、すぐにパフォーマンスの不安定性やチップ間接続の遅延、Ascendのソフトウェアプラットフォーム「CANN」の制限といった問題に直面しました。

Huaweiは問題の解決に向け、DeepSeekのデータセンターにエンジニアチームを派遣したそうですが、Ascendプラットフォームでのトレーニングは一度も成功しなかったとのこと。情報筋はフィナンシャル・タイムズに対し、DeepSeekがHuawei製チップでの開発に失敗したことで、R2のリリースが遅れていると語りました。

by Kārlis Dambrāns 最終的にDeepSeekは、「R2モデルの学習にはNVIDIA製チップを使用し、推論にはHuawei製チップを使用する」という選択をしたそうです。テクノロジー系メディアのTom's Hardwareは、「この混合アプローチは、好みというよりも必要性から生まれた妥協案と言えるでしょう」と指摘しています。 その一方で、中国ではNVIDIA製チップが不足しているため、DeepSeekの顧客の多くもHuawei製ハードウェアでR2を使用することになります。この点を考慮すると、新しいAIモデルがHuawei製ハードウェアで動作することを保証するのは理にかなっているとTom's Hardwareは述べました。

・関連記事 DeepSeekがさらに強化されたAIモデル「DeepSeek-R2」を2025年5月までに前倒しで発表か、さらにAPI利用料を最大75%割引きと発表 - GIGAZINE

DeepSeekが数学的推論に特化した「DeepSeek-Prover-V2」をひっそりとリリース、複雑な定理の形式証明に対応 - GIGAZINE

DeepSeekと清華大学の研究者がLLMの推論能力を強化する新しい手法を発表 - GIGAZINE

DeepSeekのコスト利益率は理論上1日あたり545%であることが明らかに - GIGAZINE

DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか - GIGAZINE

DeepseekがAIモデル「DeepSeek-R1-0528」をリリース、O4-miniに匹敵する性能でオープンモデルとして公開 - GIGAZINE

中国製高性能AIモデル「DeepSeek-R1-0528」はGoogleのAI「Gemini」を使用して蒸留した可能性ありとの臆測が飛び交う - GIGAZINE

DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは? - GIGAZINE

関連記事: