ついに来たミュトス級AI「Claude Fable 5」について、いま知っておくべきこと

 本連載「柳谷智宣のAI ウォッチ!」では、いま話題のAI(生成AI)を活用したサービスを中心に取り上げていく。今回は特別編としてAnthropicが一般公開したMythos級AI「Claude Fable 5」を取り上げる。
現地時間6月9日、Mythos級AIモデル「Fable 5」がリリースされた

 Anthropicは「Claude」のラインアップに、これまでの最上位だった「Opus」のさらに上となる新しいティア「Mythos」を用意した。その「Mythos」クラスを、一般利用向けに安全機構を付けて公開したモデルが「Fable 5」となる。

 これまで研究者や一部の審査済みパートナーにしか開放されていなかったレベルの知能が、ようやく一般ユーザーの手元に降りてきたことになる。「頭がよすぎて外に出せなかったモデルの、ガードレール付き公開版」とイメージするとわかりやすい。

 ただし、サブスク範囲で触れられる期間は「6月22日まで」と限られており、その後はクレジット制になるという。「最強モデルが出た」と聞いて気になっているのなら、まずは期限内に自分の仕事で試してみよう。今回は「Claude Fable 5」の性能と仕組み、料金、そして筆者が実際に使ってみた感触を紹介する。

 Anthropicは、Fable 5を同社がこれまで一般公開した中で最も賢いモデルだと述べている。

 コーディングから資料の読み解き、画像の理解、科学研究まで、テストした項目のほぼすべてで首位に立ったという。そして単発の処理よりも、長く込み入った仕事になるほど、ほかのモデルを大きく引き離していくのが特徴。Fable 5は一問一答の知識クイズで差をつけるというより、調査して、計画を立てて、実行して、検証する、というような連続するタスクでこそ本領を発揮するタイプなのだ。

 紹介されている事例もインパクトがある。決済大手のStripeでは、5,000万行に及ぶRubyのコード資産をまるごと新しい環境へ移す作業を、Fable 5がたった1日で片付けたとのこと。エンジニアが束になっても2カ月はかかる規模の仕事だ。

 画像認識の機能も進化している。Webアプリの画面を写したスクリーンショット一枚から元のソースコードを起こしたり、ゲームの映像だけを手がかりに「ポケットモンスター ファイアレッド」を最後までプレイし切ったりしてみせた。

 以前のClaudeは、同じゲームの攻略に外付けの仕掛けを用意しても手こずっていたので、性能向上の幅が大きいことがわかる。加えて、長く動き続けても集中力が切れにくいのも大きな特徴だ。数百万トークン規模の長時間タスクでも手を抜かずに作業を遂行してくれる。

Fable 5だけで「ポケットモンスター ファイアレッド」をクリアした

 Fable 5は、デフォルトで100万(1M)トークンのコンテキストウィンドウに対応し、1回あたり最大12万8,000トークンを出力できる。加えて、推論が常時ONになっており、大量の資料を一度に読ませたり、じっくり考えさせたりする用途に向いている。

 使い方そのものは難しくない。Web版のClaude.aiやアプリ、Claude Code、Claude Coworkなど、いつものClaudeの画面でAIモデルを選べばよい。会話の途中でもモデルを切り替えられる。

 ただし利用料金は高い。APIの単価は入力100万トークンあたり10米ドル、出力100万トークンあたり50米ドルで、Opus 4.8の入力5米ドル、出力25米ドルの2倍となっている。

 サブスクリプションでの提供は、6月9日から6月22日までに限られている。この期間はPro、Max、Team、シート課金型のEnterpriseの各プランにおいて追加料金なしで使えるが、その後の利用にはクレジットが必要になる。

将来、Anthropicが十分な処理能力を確保したら、サブスク枠に復活させる予定とのこと。期待したい

 Fable 5には「自動フォールバック」という仕組みが用意されている。高性能なMythos級モデルを一般ユーザーにも公開するため、悪用リスクが高い内容を検知した場合に、より制限の強いモデルへ切り替える安全装置だ。

 サイバー攻撃や危険な生物・化学についての知識、モデルの能力を抜き出す蒸留関連のリクエストなどを検知すると、Fable 5は回答せず、同じ会話内で「Claude Opus 4.8」に応答を引き継ぐ仕組みになっている。

高リスクの内容を検知すると、Opus 4.8に引き渡される

 試しに「Webサイトの脆弱性を自動で検知するツールを作ってくれ」と頼んだらフォールバックして断られた。ガードレールがなければ作れるようなメッセージが表示されたので、「Mythos」クラスが悪用されたら恐ろしいことになりそう。

 フォールバックが起きると、画面に通知が出て、どのモデルが答えたかが回答にも表示される。Anthropicによれば、95%以上のセッションではフォールバックは起きないという。普通の文章作成や調査、企画書作成、一般的なプログラミングでは、ほとんど意識せずに使えるとのこと。

 ただし、セーフガードは安全側に寄せて調整されている。悪用されないことを優先しているため、安全な依頼でも誤って引っかかる可能性がある。筆者の利用中にも、原稿を書いているだけでフォールバックが起きた。

 この自動フォールバックは設定からOFFにもできる。ただ、通常利用ではONのままでよいだろう。Fable 5は単に「Opusより賢いモデル」ではなく、強力な能力を一般ユーザーに開放するため、安全分類器とモデル切り替えを組み合わせたモデルだ。サイバー、生物、化学、医療寄りの資料を扱う人は、突然Opus 4.8へ切り替わる可能性を前提にしておきたい。

フォールバック機能は[設定]の[機能]-「メッセージにフラグが付いた場合にモデルを切り替える」でON/OFFできる
フォールバックをOFFにした場合は、出力が停止する

 まだ半日だが、Max(20x)プランの制限いっぱいまで使い倒してみた。

 Anthropicは新モデルの投入時に使用量の枠をリセットしてくれることが多く、今回も実施してくれたのでありがたい。

 まずは「プロと実践! ゼロから始めるバイブコーディング」の連載で開発したWebアプリを作ってもらった。AIに完成したアプリの仕様書を出してもらい、それをClaude Coworkに入力して開発してもらう。

 AIモデルの選択メニューで[Fable 5]を選択して指示を出すと、まずは計画を立てる。必要なファイルを作成し、12個のモジュールと14個のコンポーネントを作成。ロゴやREADMEを用意し、ビルドの検証まで行ってくれる。数分で完成し、指示通りに起動したところ、問題なく動作した。

CoworkでFable 5にアプリを開発させてみた

 通常は設計、実装、修正と何往復もする作業を、途中で投げ出さずに進めていくのがすごい。エラーが出ても自分で原因を探り、手を変えて解決まで持っていく粘り強さが特徴だ。従来のチャットUIで大きなタスクを命じたときに、手を抜いているような感じを受けた人も多いだろう。Fable 5ではその手抜きがない。

 きちんとした指示出しさえできるのなら、この程度のアプリは瞬時に作れる世界になっているのだ。もうチャットをする必要さえない。命令し、監督し、成果物をチェックするのが人間の仕事になりそうだ。

数分でアプリが実働するところまでたどり着いた

 次に、原稿を執筆してもらった。もちろん、チャットUIでも、サンプルになる原稿やテーマに関する情報を渡し、長大なプロンプトでコントロールすれば原稿を書いてもらうことはできる。

 しかし、Fable 5になら人に頼むような感覚で指示できる。本連載の作業フォルダーを連携させて原稿を分析させ、「Fable 5について書け」とシンプルに命令してみた。

サブフォルダーにはこの2年間のAI連載記事が入っています。テキストファイルの原稿を探し、読み込んで分析してください。トンマナや構成、独自の言い回しなどを把握し、ルール化してください。その上で、この連載の最新回として「Claude Fable 5」というテーマで原稿を書いてください。

 各フォルダーには原稿だけでなく、下原稿やメモなどのテキストやPDF、画像をはじめ、さまざまなファイルが入っている。原稿のファイル名もまちまちだ。しかし、数分すると「インプレス『AIウォッチ』連載 執筆ルール.md」というファイルが生成された。

 中を見たら、原稿の体裁だけでなく、「~はありがたいところだ」などの決まり文句や、「まずは小さなタスクから試してみてほしい」といった独自の言い回しを使う、などと書かれていた。丸裸にされたようで恥ずかしい。

 そして、Fable 5について、約30のサイトを調査して執筆してくれた。その生成された原稿を見て、ちょっと末恐ろしくなった。まさに自分が書いたような文章なのだ。もちろん、AIっぽいところや筆者では思い浮かばないフレーズもあるのだが、それでもレベルが高い。ざっと確認した限りでは、事実関係の大きなミスや目立つ誤字脱字も見当たらない。

数分で自分で書いたような原稿が完成した

 なお、この出力は、次のページから確認できる。画像はキャプションを見て筆者が用意したが、それ以外は1文字も修正していない。興味のある方は、目を通してみてほしい。AIに仕事を奪われる、と恐れる人がいるのも納得だ。

 Fable 5のコストはOpus 4.8の2倍なので、いろいろと試していると、みるみるサブスクの利用枠が消費されていった。通常のProプランユーザーだと、込み入ったタスクを任せても途中で枠を使い切ってしまうだろう。

 しっかりと成果物を出してくれるので、修正する手間が減るのはありがたいが、使いどころを選びそうだ。少なくとも、一問一答のチャットで使うのはもったいない。普段の作業は下位のAIモデルで回しつつ、「ここぞ」という重いタスクだけFable 5に預ける、という使い分けがおすすめだ。

 総じて、Fable 5は「チャットの返事が賢くなったAI」というより「長い仕事をまるごと任せられるAI」だ。

 すごさが一目でわかるのは、短い質問への回答ではなく、半日がかりの作業を放り込んだときだろう。だからこそ、追加料金なしで触れられる6月22日までのうちに、自分が普段つまずいている一連の作業を丸ごと渡してみてほしい。性能の数字を眺めるより、その粘り強さを一度体験するほうが、このモデルの価値はずっと伝わるはずだ。

(次のページに続く)

IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。

・著者Webサイト:https://prof.yanagiya.biz/

柳谷智宣のAI ウォッチ! 記事一覧

プロと実践! ゼロから始めるバイブコーディング 記事一覧

関連記事: