Mistral AIが同社初の推論モデル「Magistral」を発表、専門分野の深掘りに対応してステップ推論に特化

ソフトウェア

フランスのAI企業であるMistral AIが、同社初となる推論モデル「Magistral」を発表しました。Magistralはドメイン固有の知識、透明性、そして多言語での推論能力に優れているとされており、人間の思考が直線的ではないという考えに基づき、論理・洞察・段階的な分析を織り交ぜながら思考するように設計されています。

Magistral | Mistral AI

https://mistral.ai/news/magistral

Magistral: How to Run & Fine-tune | Unsloth Documentation

https://docs.unsloth.ai/basics/magistral-how-to-run-and-fine-tune

magistral.pdf

(PDFファイル)https://mistral.ai/static/research/magistral.pdf Mistral AIが開発した推論モデル「Magistral」には、「Magistral Medium」と「Magistral Small」という2つの主要なバリエーションが存在します。

より高性能なエンタープライズ向けのバリエーションであるMagistral MediumはMistral Medium 3を基盤としており、既存の推論モデルから学習データを流用することなく、純粋な強化学習(RL)のみでゼロから推論能力を鍛え上げた点が大きな特徴です。

その結果、Magistral Mediumは数学ベンチマークのAIME 2024で73.6%という高い正答率を達成し、多数の回答から最も多いものを選ぶ多数決投票では90%に達します。

さらに、Magistral Mediumは英語だけでなく日本語や中国語、フランス語、スペイン語、ドイツ語、イタリア語、ロシア語、アラビア語など、多くの言語で高い推論能力を維持し、テキストデータのみの学習にもかかわらず画像を含む問題解決能力も向上しています。なお、Magistral Mediumの具体的なパラメータ数は公開されていません。 一方、Magistral Smallは、コミュニティによる開発や研究を促進するために公開されたオープンソースのバリエーションです。パラメーター数は240億パラメーターで、Apache 2.0ライセンスの下で提供されています。

Magistral Smallの開発アプローチはMediumと異なり、まず強力な教師役であるMagistral Mediumが生成した思考プロセスを用いて教師ありファインチューニング(SFT)を行い、その上で強化学習を適用するという二段階のプロセスを経て性能が強化されました。 Magistral SmallもAIME 2024で70.7%という高いスコアを記録しており、高性能ながら個人のPC(例えばRTX 4090搭載機や24GB程度のRAMを持つMac)でもローカルで実行できる手軽さも備えています。モデルはHugging Faceなどのプラットフォームから自由にダウンロードし、自己展開することが可能です。 Magistralの大きな特徴が「透明性」で、モデルが結論を出す前に思考プロセスを<think>タグ内に書き出すことで実現されており、ユーザーはその推論過程を追跡・検証できます。以下はMagistralのシステムプロンプトです。

興味深いことに、Magistralはテキストデータのみで訓練されたにもかかわらず、画像の内容を理解し推論するマルチモーダル能力が低下するどころか、むしろ向上したことが報告されています。

Magistral Mediumは、Mistral AIの対話サービス「Le Chat」のプレビュー版やAPIを通じて試用できるほか、Amazon SageMakerIBM WatsonXAzure AIGoogle Cloud Marketplaceといった主要なクラウドプラットフォームでも順次利用可能になる予定です。Magistral SmallはオープンソースモデルとしてApache 2.0ライセンスで公開されており、Hugging Faceからダウンロードして誰でも利用できます。

mistralai/Magistral-Small-2506 · Hugging Face

https://huggingface.co/mistralai/Magistral-Small-2506

・関連記事 科学的に正しい分子設計が可能な化学特化AI推論モデル「ether0」登場、既存の言語モデルに強化学習を施して人間や既存AIを上回る性能を発揮 - GIGAZINE

Mistral AIがローカル環境で動作する小型で高性能なエージェント型コーディングAI「Devstral」を発表 - GIGAZINE

低コストかつ高性能なAIモデル「Mistral Medium 3」登場、GPT-4oやLlama 4 Maverickを超える性能を実現&より高性能な大型モデルも準備中 - GIGAZINE

高速かつ高精度な文字認識AIモデル「Mistral OCR」が登場、LaTeXで書かれた数式や図表入りPDFのレイアウトを崩さずマークダウン形式で出力できてJSONへのデータ抽出も簡単に - GIGAZINE

Mistral AIが多言語&240億パラメータのマルチモーダル・オープンソースAIモデル「Mistral Small 3.1」発表、32GBのRAMで動作しGemma 3やGPT-4o miniよりも優れているとアピール - GIGAZINE

関連記事: