Microsoftが小規模推論モデル「Phi-4-reasoning」「Phi-4-reasoning-plus」「Phi-4-mini-reasoning」を発表

ソフトウェア

Microsoftが小規模推論モデル「Phi-4-reasoning」「Phi-4-reasoning-plus」「Phi-4-mini-reasoning」を発表しました。Phi-4-reasoningは、小規模言語モデルのPhi-4に対して教師ありファインチューニング(SFT)を行い、明示的に推論能力を向上させたモデルとなっています。

One year of Phi: Small language models making big leaps in AI | Microsoft Azure Blog

https://azure.microsoft.com/en-us/blog/one-year-of-phi-small-language-models-making-big-leaps-in-ai/

Phi-4-reasoning Technical Report - Microsoft Research

https://www.microsoft.com/en-us/research/publication/phi-4-reasoning-technical-report/ Phi-4は2024年12月にリリースされた、パラメーター数140億(14B)という小規模言語モデルです。

Microsoftが軽量なのにGPT-4oを圧倒的に上回る数学性能を発揮するAIモデル「Phi-4」をリリース - GIGAZINE

今回発表されたPhi-4-reasoningはこのPhi-4を基本モデルとして「適切な複雑さと多様性を持つ慎重に選別されたプロンプト」と「o3-miniを使用して生成された高品質な長い推論過程を含む回答」、「数学やコーディングなど多岐な分野にわたる140万以上のプロンプトと応答」を用いてSFTを行い、明示的に推論能力を向上させた14Bパラメーターのオープンウェイト推論モデルです。 また、Phi-4-reasoning-plusは数学的推論に焦点を当てており、Phi-4-reasoningに約6400問の数学問題を用いて強化学習を適用したモデルとなっています。この強化学習フェーズでは結果ベースの報酬関数を使用して、数学問題について正しい解答を生成するモデルの能力をさらに向上させているとのこと。Phi-4-reasoning-plusはPhi-4-reasoningよりも出力の長さが1.5倍長く、より多くの推論ステップを含んで高い精度の回答を実現しますが、その分推論時の計算リソースもより多く使います。 Phi-4-reasoning(緑)とPhi-4-reasoning-plus(濃緑)のベンチマーク結果は以下の通りで、Phi-4よりも高いスコアをたたき出しました。また、Math-500とGPQA Diamondでは、OpenAI o1-miniを上回っています。ベンチマークはいずれも数学や科学、コーディングの性能を計測するもので、Phi-4-reasoningやPhi-4-reasoning-plusの推論能力の高さが示されています。

Phi-4-mini-reasoningはよりコンパクトな推論モデルへの需要に応えるように設計されており、パラメーター数は38億(3.8B)という比較的軽量なモデル。Phi-4-miniと同じアーキテクチャを共有し、DeepSeek-R1などで生成されたコンテンツでファインチューニングされています。メモリや計算が制約された環境で高度な数学的推論能力を必要とするアプリケーション向けに設計されているため、教育アプリケーションや組み込みアプリ、あるいはエッジ/モバイルシステムへの応用に適しているとMicrosoftは述べています。

また、MicrosoftはPhi-4-reasoningの安全性を重視しているアピールしており、Microsoftの「責任あるAI原則」に準拠していると述べています。

Phi-4-reasoning、Phi-4-reasoning-plus、Phi-4-mini-reasoningは、AIプラットフォームのHugging Faceで公開されています。また、Phi-4-reasoningとPhi-4-mini-reasoningはAzure AI Foundryでも利用可能になっており、Phi-4-reasoning-plusは近日中にAzure AI Foundryへ導入される予定となっています。

microsoft/Phi-4-reasoning · Hugging Face

https://huggingface.co/microsoft/Phi-4-reasoning

microsoft/Phi-4-reasoning-plus · Hugging Face https://huggingface.co/microsoft/Phi-4-reasoning-plus

microsoft/Phi-4-mini-reasoning · Hugging Face https://huggingface.co/microsoft/Phi-4-mini-reasoning

Phi-4-reasoningとPhi-4-mini-reasoningモデルは、Phi Silicaと呼ばれるNPU最適化版でCopilot+ PCに統合される予定で、Copilot+ PCに統合される予定です。Phi SilicaはCopilot+ PCで利用可能なAI機能をローカルで実行するために使われており、Phi-4-reasoningの導入によってさらなる高速なレスポンスと電力効率の良いトークン処理が可能になるとMicrosoftはアピールしました。

・関連記事 Microsoftが軽量なのにGPT-4oを圧倒的に上回る数学性能を発揮するAIモデル「Phi-4」をリリース - GIGAZINE

Microsoftがコスト効率の高い小さめの言語モデル「Phi-3」をリリース、オープンモデルで商用利用可能 - GIGAZINE

Microsoftが小規模言語モデル「Phi-2」をリリース、小規模なのに最大25倍サイズのモデルと同等以上の性能 - GIGAZINE

MicrosoftがすべてのCopilot+ PC用言語モデル「Phi-Silica」一般提供を発表 - GIGAZINE

関連記事: