ついにChromeがAI秘書化。面倒なネット操作や入力を「Geminiが丸ごと代行する」新時代へ
「URLを入力するのすら面倒くさい……」そう感じたことはありませんか? Googleがその悩みを解決してくれるかもしれません。
1月28日、GoogleはChrome版Geminiの大幅な拡張を発表しました。
注目は、常にブラウザの横で作業をサポートしてくれる「AIアシスタント(コンパニオン)」の刷新されたデザインや、統合された画像編集ツール。そして何より驚きなのが、AIがネットサーフィンを丸ごと代行してくれる「Auto Browse(自動ブラウジング)」機能の登場です。
ブラウザ横に常駐!進化したサイドパネル
Image: GoogleこれまでのChrome版Geminiは、ブラウザ上部の小さなボックスに表示されていたため、タブを切り替えるときなどに少し使いにくい面がありました。
今回のアップデートでは、スクロール可能なサイドパネルへと移動。表示領域が広くなっただけでなく、閲覧中のコンテンツを邪魔することもありません。
Webサイトの右側に常駐してくれるので、Geminiの回答とサイトの内容を見比べたり、複数のタブを頻繁に行き来しながらでも、スムーズにやり取りを続けられます。
もちろん、開いている複数のタブをまとめて参照して回答させるといった従来の機能もそのまま使えます。ちょっとした変更ですが、使い心地はぐっと良くなりそうです。
Nano Bananaで画像の即時編集が可能に
Image: GoogleGoogleの最新画像生成モデル『Nano Banana』も、今回のアップデートでより身近になりました。
画像を右クリックするだけで、わざわざダウンロードしてGeminiに再アップロードする手間なく、そのまま編集できるようになりました。
また、サイドパネルのGeminiに対し、「画面に映っているこの画像を編集して」と自然な言葉で指示を出すことも可能。
Googleによれば、ブラウザ上で表示できるほぼすべての画像でこの機能が利用できるとのことです。
他人の画像も編集可能?便利さと背中合わせの倫理的リスク
Googleは画像編集のデモをGoogleフォトのライブラリを使って行いましたが、「編集できるのは自分の画像だけ」とは明言していません。
これには、私も即座に危うさを感じました。というのも、イーロン・マスク氏のX(旧Twitter)が、まさにこの点について批判を浴びているからです。
XはAI「Grok」で他人の画像を許可なく編集できる機能を公開しましたが、不適切な投稿が相次いだ結果、機能の制限を余儀なくされました。
こうした懸念に対し、Googleの広報担当者は次のように回答しています。
「性的・暴力的なコンテンツ生成を禁止する明確なポリシーがあり、技術的なガードレールも設けています。その精度は日々向上しています」
著作権回避への懸念については明言を避けましたが、Google側はあくまで技術的な対策(ガードレール)で対応するスタンス。とはいえ、いくら善意のアップデートでも「アクセスが容易になる」ということは、一気にリスクが顕在化する引き金にもなりかねません。
エージェント機能「Auto Browse」の実力
Image: Google今、AI界隈でもっともホットなキーワードは、AIが自ら判断して動く「エージェント(自律型AI)」です。Googleもこのトレンドに乗り、Geminiにブラウザの操作権限を与えました。
この機能は、月額制の有料プラン「Gemini Advanced」を利用しているユーザーに限定して提供されますが、Chromeに「自動ブラウジング(Auto Browse)」と頼むだけで、情報の調査からサイトの移動、フォームの入力まで代行してくれます。
作業は非常にスマートで、AIがWeb上を移動する様子を眺めることもできれば、裏で作業を任せて自分は別のタブでクリエイティブな作業を進めることも可能に。
複数のタブで同時に実行できるため、いくつかのタスクを並行して進めるのにも向いています。
また、AIが今どのようなステップを踏んで操作しているかはサイドパネルに順番に表示されるため、進捗のチェックも簡単です。
ジャーナリスト向けのデモでは、AIが特定の商品を見つけ出し、ショップサイトへ移動してGoogleパスワードマネージャーでログインしてから、カートに入れるまでの一連の流れが披露されました。
他にも、確定申告の書類集めや、不動産サイトでの物件比較、アップロードしたPDFの情報を使ったフォーム入力など、幅広い活用シーンが想定されています。
安全性は万全?AIに操作を任せるリスク
非常に便利な機能に見えますが、「本当にAIを信頼してブラウジングを任せても大丈夫か?」という疑問も湧いてきます。
私が懸念しているのは、主に怪しいサイトへのアクセスや権限の問題。この点についてGoogleは、対策は万全だとしています。
Auto BrowseがGoogleパスワードマネージャーにアクセスする際は必ず事前にユーザーの許可を求めますし、もしAIが「安全ではない」と判断したリンクに遭遇した場合は、Chromeに既存の保護機能を使って回避するようになっています。
広報担当者は「これ以上ないほど安全」と語りましたが、私なら、少なくとも最初の数回はAIの動きから目を離さないでしょう。
また、現時点での制限も1つあり、それが「複数のタブで別々に自動操作はできるが、タブ同士の連携はできない」という点。
つまり、1つのタブで調べたことを別のタブの操作に反映させるようなことはできず、あくまで各タブがバラバラに動く形になります。これについては、将来的には改善される可能性があります。
個人的には、「確定申告の書類集め」のような機密性の高いタスクにこの機能を使うイメージはまだ持てませんが、簡単なフォーム入力を自動化してくれるのは確かに便利そうです。
Googleの説明によれば、商品の購入確定やフォームの送信といったデリケートな最終ステップでは、AIはあえて操作を止めてユーザーに引き継ぐ仕様になっているとのこと。
この点では、Geminiアプリの既存のショッピング機能と似ていますね。
Geminiが「個人秘書」になる新機能
Chrome版Geminiは、Gmailとの連携やチャット履歴の参照など、Geminiの既存機能の多くを引き継いでいますが、「今後数カ月以内」に予定されている目玉アップデートがもう1つあります。
最近、Geminiのメインアプリでは、有料ユーザー向けに「パーソナル・インテリジェンス」という機能の試験運用がはじまりました。
これは、ユーザーがいちいち指示を出さなくても、AIが過去の会話や連携アプリの内容を自ら読み取って判断してくれる機能です。
たとえば「自分の車に合う新しいタイヤを探して」と頼むだけで、AIがGmailやGoogleフォトを自動で調べ、車種や前回の購入時期を特定した上で最適な提案をしてくれます。
この機能はまだ「準備中」の段階ですが、Googleがこうした機能を急ピッチで準備していることは、どこでGeminiを使っても同じように便利な体験を提供しようとする、彼らの並々ならぬ意気込みを感じさせます。
※なお、この記事で紹介した他の機能については、すでに利用できるか、現在順次公開されています。
Source:Google