国産LLM「Sarashina3」登場 高品質データ、独自検証で日本語能力を強化 ソフトバンク傘下

 ソフトバンク傘下のSB Intuitionsは6月30日、国産大規模言語モデル(LLM)「Sarashina3シリーズ」の提供を始めた。独自の技術や品質評価によって、高品質な日本語を安定して出力できるとうたう標準モデルと軽量モデルに加え、3つの専門モデルも提供する。ソフトバンクが米Oracleの基盤を利用して国内データセンターで運用するクラウドサービス「Cloud PF Type A」を通して提供する。

Sarashina3シリーズを発表(出典:プレスリリース)

 標準モデル「Sarashina3 mini」(以下、3 mini)は外部APIを自律的に呼び出すエージェント機能や、数理的理解力、コード生成能力を備えるとうたう。日本語・英語を中心とした30兆トークン超のデータで事前学習を行い、事後学習では高性能な教師モデルの知識を学習させる「蒸留」と強化学習を組み合わせることで、ビジネスシーンで必要な能力を高めたという。

 3 miniは、日本語対話やコーディングなどのベンチマークにおいて前世代の「Sarashina2 mini」から性能が向上。他社の「Qwen3-235B-A22B-Instruct-2507」や「GPT-5.4 mini(non-reasoning)」と同等性能とされる。

ベンチマークスコア(出典:公式ブログ)

 3 miniと軽量モデル「Sarashina3 nano」(以下、3 nano)の事前学習で使用したデータ構築においては、独自の品質フィルタリングやデータ合成技術によって、多様かつ有用性の高いデータを拡充したと説明。また、両モデルが出力する日本語の自然さ、丁寧さ、簡潔さ、実用性をSB Intuitionsの専門チームが評価、検証し、その結果を強化学習などに利用することで、高品質な日本語を安定して出力できるよう調整したという。

 Sarashina3シリーズのラインアップは、3 miniと3 nanoに加えて、入出力テキストの有害性を判定するガードモデル「Sarashina3 guard」、テキストをベクトル化する「Sarashina3 embedding」、複数の文書を入力クエリと関連度の高い順に並び替えるリランキングモデル「Sarashina3 rerank」の5種類だ。

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する
SNSでシェア

関連記事: