AIを使う上で必要なのはプロンプトエンジニアリングよりも「コンテキストエンジニアリング」
元Hugging Faceのテクニカルリードで、Google DeepMindのシニアAIリレーションエンジニアであるフィリップ・シュミット氏が、AIを使う上で「コンテキストエンジニアリング」が必須であると、自身のブログで主張しています。
The New Skill in AI is Not Prompting, It's Context Engineering
https://www.philschmid.de/context-engineering一般的に、AIのレスポンスを最適化するためには、AIへの指示を具体的かつ詳細なものにする「プロンプトエンジニアリング」が有効といわれています。しかし、シュミット氏は、AIの世界ではこれまで重要視されていた「プロンプトエンジニアリング」から、より広範で強力な概念である「コンテキストエンジニアリング」へと焦点が移りつつあると論じています。
コンテキストエンジニアリングとは、AIがタスクを現実的に解決できるように、必要なすべてのコンテキストを提供するための技術です。コンテキストとは単にAIに送る指示(プロンプト)だけを指すのではなく、AIが応答を生成する前に参照する、あらゆる情報が含まれます。コンテキストを構成する要素は以下の通り。
指示・システムプロンプト:AIの基本的な振る舞いを定義する初期設定やルール
ユーザープロンプト: ユーザーが入力する具体的な質問やタスク 状態・履歴(短期記憶):それまでの会話の流れ 長期記憶:過去の対話から学習したユーザーの好みや知識 検索された情報(RAG):文書やデータベース、APIなどから取得する外部の最新情報 利用可能なツール:在庫確認やメール送信など、AIが実行できる関数の定義 構造化された出力:AIの回答形式の指定優れたAIエージェントを構築する秘訣は、複雑なコードを書くことではなく、いかに質の高いコンテキストを提供できるかにあるとシュミット氏。 例えば、AIアシスタントに「明日、簡単な打ち合わせの時間はありますか?」というメールで予定調整を頼んだとします。この時、AIエージェントが受け取っているコンテキストの質が低いと、受け取ったメールの文面しか見ないため、「ありがとうございます。明日は大丈夫です。何時ごろがご希望ですか?」といった、機械的で役に立たない返答しかできません。 しかし、カレンダー情報や相手との過去のメール、連絡先リスト、メールを送れるようなツールなどをコンテキストとして与えた場合、AIエージェントは「こんにちは!申し訳ありません、明日はスケジュールが一日中詰まっております。木曜の午前中なら空いていますが、いかがでしょうか?招待を送っておいたので、ご都合をお聞かせください」というメールを返答してくれるようになります。 シュミット氏は、AIが魔法のようなレスポンスを返してくれるのは、AIモデルの賢さやアルゴリズムの巧妙さによるものではなく、適切なタスクに適切なコンテキストを提供した結果だと述べ、AIエージェントの失敗の多くは、コンテキストの失敗に起因すると主張しています。
プロンプトエンジニアリングが単一のテキストで完璧な指示文を作成することに焦点を当てるのに対し、コンテキストエンジニアリングは単なる「文字列」ではなく、AIの処理が実行される前に稼働する「システム」として機能します。 コンテキストエンジニアリングによって、ユーザーは当面のタスクに合わせてその場で動的にコンテキストを生成し、モデルが必要な時にのみ役立つ情報とツールを提供することで、AIエージェントが重要な詳細を見逃さないようにすることができます。加えて、情報の提示方法、つまり「フォーマット」も重要であり、例えば生のデータをそのまま渡すよりも簡潔な要約の方が優れているといえます。
シュミット氏は、強力で信頼性の高いAIエージェントを構築するために重要なのは、もはや「魔法のプロンプト」やモデルのアップデートを探すことではないと論じています。ビジネスの目的を理解し、AIがタスクを達成するために必要な情報とツールを適切な形式とタイミングで提供する「コンテキストエンジニアリング」こそが、今後の成功の鍵を握るのだとシュミット氏は主張しました。
・関連記事 どの画像生成AIがプロンプトに忠実な画像を生成できるのか分かる「GenAI Image Showdown」 - GIGAZINE
Perplexityがプロンプトを入力するだけで「アプリ自動開発」や「レポート自動生成」などの高度なタスクを実行できる「Perplexity Labs」を発表 - GIGAZINE
AI検索エンジンのPerplexityがユーザーのプロンプトに基づいてカスタマイズ可能なウェブページを生成する「Pages」機能を発表 - GIGAZINE
大規模言語モデルへの入力プロンプトを意味を保ったまま高度に圧縮する技術「LLMLingua」をMicrosoftが開発 - GIGAZINE
画像生成AI「DALL-E」のシステムメッセージが発見され「プロンプトは大文字にした方がいいのか?」などと指摘されてしまう事態に - GIGAZINE
AIの力だけでAngry Birdsのコピーゲームを作成したエンジニアが登場、作成時に使用したプロンプトも公開中 - GIGAZINE