GoogleのAI「Gemini」をScale AIがトレーニングしようとしたら未審査のフリーランサーによるあまりにも粗悪な仕事が横行していたことが判明

2025年06月30日 07時00分ソフトウェア

AIスタートアップのScale AIは、GoogleやMeta、OpenAI、xAIといった世界有数のテクノロジー企業を顧客に持ち、「AI時代のインフラ企業」として高く評価され、巨額の資金調達や戦略的パートナーシップを通じて急成長を遂げてきました。しかし2025年に入り、AI開発を支えるデータ提供企業として急成長してきたScale AIに、複数の深刻な問題が相次いで発覚し、同社の信用に大きな揺らぎが生じていると報じられています。

Exclusive: Scale AI's Spam, Security Woes Plagued the Company While Serving Google

https://www.inc.com/sam-blum/exclusive-scale-ais-spam-security-woes-while-serving-google/91205895

Business Insiderの調査報道によると、Scale AIはGoogleドキュメントを業務管理に使用しており、その中でMetaやGoogle、xAIなどの大手顧客に関する機密文書を、リンクを知っていれば誰でも閲覧・編集できる状態でオンライン上に公開していたとのこと。これらの文書は約85件、300ページ以上に及び、たとえばGoogle社内でChatGPTを用いてBard(今のGemini)の改良を試みる「Project Bulba」の詳細や、契約業務に携わるフリーランサーの氏名、メールアドレス、評価、業務履歴などが含まれていました。

Scale AIでは、スプレッドシート形式で業務内容を記録しており、「正確性が高い」「事実誤認あり」「詐欺の可能性がある」といった評価が、作業者の氏名とともに記載されていたとされます。問題はこの情報が外部から容易にアクセス可能な状態で長期間放置されていた点であり、Business Insiderは「意図せぬ公開」というには規模も期間も深刻すぎると指摘しています。また、サイバーセキュリティの専門家らも、文書の中にはAPIキーや顧客プロジェクト名などの漏洩リスクが高い情報が含まれていたとして、極めて重大な管理ミスであると警鐘を鳴らしました。

この情報流出が明るみに出たことで、Scale AIは突如として大量のドキュメントを非公開設定に切り替える措置を取りました。しかし、すでに大手顧客の間では不信感が広がっており、最大の顧客であるGoogleが契約を打ち切る意向であることが、ロイターによって報じられています。こうした問題の背景には、Scale AIが業務の一部を大量の外部フリーランサーに委託し、その管理体制に重大なほころびがあったことも挙げられます。アメリカメディアのIncによれば、Geminiを含むGoogle向けのAIトレーニングや評価プロジェクトには、十分な審査を経ていない請負業者が参加しており、提出された作業の多くは意味不明な文字列やコピペによるスパム的内容で占められていたとのこと。報道によれば、一部の作業者は、他人のアカウントを買い取って業務に参加していた疑いもあり、結果としてAIの学習精度に悪影響を与えかねない事態が発生していた模様。こうした粗悪なデータの氾濫も、Googleが契約を打ち切る判断を後押しした要因のひとつと見られています。

ロイターによると、Googleは2024年にはScale AIに対して1億5000万ドル(約217億円)以上を支払い、2025年もさらに2億ドル(約290億円)規模の契約を予定していました。しかし、MetaによるScale AIへの出資を受けて、契約打ち切りの方針を固めたということです。この「Metaとの関係強化」は、Googleにとって競合他社との利害対立を意味するため、取引を継続するのは難しいと判断されたと見られます。さらに、Microsoft、OpenAI、xAIといった他のテック大手も、Scale AIとの関係の見直しを進めているとされ、同社は主要な収益源を一挙に失う可能性に直面しているとのこと。

一方で、ベンチャーキャピタルのAccelは、Scale AIに対してこれまで3億5000万ドル(約506億円)を投資し、同社株式の18.5％を保有していており、Metaによる148億ドル(約2兆1400億円)の出資によって25億ドル(約3600億円)以上の利益を得る見通しであるとBloombergが報じています。

MetaがAI企業「Scale AI」に1.4兆円規模の投資を行う方向で協議、Metaの社外AI投資では最大規模 - GIGAZINE

今回の出資により、Metaは議決権を持たない形でScale AIの支配権を一部取得し、事実上、戦略的パートナーとなりました。この出資に関連し、Scale AIの創業者でありCEOであるアレクサンダー・ワン氏は、Metaに移籍することとなり、同社が新設する「スーパーインテリジェンス(超知性)」に特化したAI研究所で、AIの次世代開発に取り組む予定であることが報じられています。Metaはこの研究所のために、GoogleやOpenAIなど他社から研究者を積極的に引き抜いており、一部の報道では数十億円規模の報酬が提示されていると伝えられています。

MetaはScale AIのCEOであるアレクサンダー・ワン率いる「スーパーインテリジェンス(超知性)」の追求に特化したAIラボの構築を計画、OpenAIやGoogleからAI研究者を引き抜くべく数億～数百億円の報酬を用意 - GIGAZINE

加えて技術面では、Scale AIは2024年に「SEAL Leaderboards」と呼ばれるパフォーマンス評価プラットフォームを公開し、数学、コーディング、言語理解など複数の分野において、LLMの性能をプライベートデータセットで比較評価しています。しかし、こうした取り組みも、今回の情報管理の甘さを受けて評価が揺らいでいるといえます。

OpenAIの元CTOであるミラ・ムラティがAIと人間の相互作用に焦点を当てたAIスタートアップ「Thinking Machines Lab」を設立 - GIGAZINE

OpenAIから独立したイルヤ・サツキヴァーの「Safe Superintelligence」が10億ドルを調達、評価額は50億ドルか - GIGAZINE

Character.AIの共同創設者たちがGoogleへ移籍、GoogleはCharacter.AIの技術を使用するための非独占的契約に署名 - GIGAZINE

OpenAIが評価額約23兆円で約9700億円の資金調達を完了、Microsoft＆NVIDIA＆ソフトバンクがラウンドに参加か - GIGAZINE