【徹底検証】ClaudeとChatGPTとNotebookLM、正しく図解作成できたのはどのAI?

Claude Designが登場するやいなや、世界を席巻しました

巷の噂では、UIデザイナーたちがすでにLinkedInの肩書きを「プロンプトエンジニア」に書き換えはじめているとか…まあ、これは(大体は)ジョークです。

しかし、Claude Designが純粋にすばらしいのは事実です。

時を同じくして、OpenAIはChatGPTに搭載されている最高水準の画像生成機能を「ChatGPT Images 2」へとアップグレードしました。プロンプトへの忠実度が大幅に向上し、AI画像生成における最大の課題の1つであった「テキスト」の問題も解決したように見えます。

一方でNotebookLMは、以前からテキストを多用する画像生成の分野に参入していました。ソース資料からスライド資料やインフォグラフィック、その他の視覚的な要約を生成することが可能です。

これまで、テキスト描写は画像生成モデルにとって奇妙な弱点であり続けてきました。画像の中にテキストを生成すること自体、少しばかり問題があります。

というのも、テキストとは本来「書く」べきものだからです。Claude Designは、厳密にはChatGPT ImagesやNotebookLMと同じカテゴリーには属しませんが、それでも私はテストしてみたいと考えました。何しろ、彼らは「何でもデザインできる」と言っているのですから。

私は「視覚的でありながらテキストが多いもの」を求めました。インフォグラフィック以上に最適なテストがあるでしょうか?

真剣勝負の舞台:ラズパイの設計図を描けるか?

テストの内容はシンプルです。「Raspberry Pi 4 Model B」のインフォグラフィックをデザインすること。これは絶好のベンチマークになります。

設計図スタイルの技術図解は情報が密集しています。大量のテキスト、多数のラベル付けが必要で、細部をわずかに間違える隙がいくらでもあります。

どのツールがテキストを正しく書けるか、そのテキストを正しい図形に紐付けられるか、そしてそもそも、それらの図形を正しく描けるかを見極めるにはうってつけです。

Studio内にあるNotebookLMのインフォグラフィックツールは、Geminiの画像生成を使用しています。ChatGPTはChatGPT Images 2を使用。これらはどちらも「画像生成モデル」です。

対してClaude Designは異なります。これは画像モデルではなく、テキストモデルである「Opus 4.7」を使用しています。

言い換えれば、Claude Designの実体は普段チャットしているOpus 4.7そのものですが、UIデザイン用にツールが与えられ、微調整されているのです。Claude Designが「エージェント」であり、Opus 4.7が「モデル」という関係です。

したがって、通常の意味での画像生成ではなく、Claude DesignはリクエストされたビジュアルをHTMLとCSSで構築します。

それでも、私はテストしたいと思いました。Claude Designには何か秘策があるかもしれません。独自のアセットを生成または組み立てる能力が、競合に勝るレベルにあるかもしれないからです。確かめる方法は1つしかありません。

テストにあたり、3つのツールすべてに同じソース資料を与えました。Raspberry Pi 4のGPIO図面、技術仕様を記したテキストファイル、そして公式の製品説明PDFです。

その上で、全員にまったく同じプロンプトを次のように入力しました

入力プロンプト:

Raspberry Pi 4 Model Bのブループリント風インフォグラフィックを作成してください。

背景はダークネイビー、線画は白とシアン、薄いグリッドを重ねてください。

内容は、概要と対象読者、主要スペック、各コンポーネントにラベルを付けた基板の上面図、色分けされた40ピンGPIOピン配置、およびユースケースのセクションを含めてください。

全体に引き出し線、破線のセクション区切り、等幅のテクニカルフォントを使用し、A3横向きのレイアウトにしてください。

それでは、結果を判定していきましょう。何が起きたのか見てみましょう。

関連記事: