Googleが遺伝子変異の影響を分析できるAI「AlphaGenome」を発表、100万塩基対を一度に入力可能で遺伝子疾患の治療法確立などに役立つ可能性
ヒトを含む生物のDNAには「アデニン(A)」「チミン(T)」「グアニン(G)」「シトシン(C)」という4種類のヌクレオチドが何億個も並んでおり、「A」「T」「G」「C」の配列によって生物の多様な形質が決定されています。このATGCの並び方は「塩基配列」と呼ばれており、何らかの要因で塩基配列の一部が変異すると遺伝子疾患などの影響が生じることがあります。これらの「塩基配列の変化による影響」を分析できるAI「AlphaGenome」がGoogleの研究チームによって開発されました。
AlphaGenome: AI for better understanding the genome - Google DeepMind
https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/Googleは2023年9月に遺伝子変異の有害性を予測するAI「AlphaMissense」を発表しています。AlphaMissenseはゲノムのうち「どんなタンパク質を作るかが記された領域」を対象としたものでしたが、今回発表されたAlphaGenomeはタンパク質の設計図としては機能していない「非コード領域」も対象にできることを特徴としています。非コード領域はゲノムの大部分を占める領域で、以前はそれほど重要視されていませんでしたが、近年の研究で「遺伝子のオン・オフを調節する機能」など重要な機能を持っていることが明らかになっています。
AlphaGenomeは「Transformer」をベースに開発された遺伝子研究向けAIアーキテクチャ「Enformer」を用いて構築されています。また、学習データには「ENCODE」「GTEx」「4D Nucleome」「FANTOM5」といった遺伝子情報データベースを活用しています。
AlphaGenomeには最大100万の塩基配列を一度に入力可能で、遺伝子制御の複数ステップにわたる複雑な制御を包括的に分析可能です。また、AIモデルとしては初めて「遺伝子変異がRNAスプライシングに与える影響」の分析にも対応しました。
AlphaGenomeと既存の遺伝子分析AIモデルのベンチマーク結果を比較したグラフが以下。AlphaGenomeは既存モデルと比べて大幅に高いパフォーマンスを示しています。Googleは非営利の研究者向けにAlphaGenomeのAPIを提供しており、遺伝疾患の原因特定やDNA合成分野の発展などに活用できるとアピールしています。一方で現時点のAlphaGenomeには「調節因子から10万塩基対ほど離れると、影響の予測が困難になる」「分子レベルの結果は予測できるが、形質や疾患への関わり方の全体像は予測できない」といった問題点が存在しているとのこと。研究チームはこれらの問題点を解決するべく研究を進めているそうです。 AlphaGenomeのAPI紹介ページが以下。紹介ページには各種ドキュメントへのリンクやGoogleへの連絡先などがまとまっています。
AlphaGenome
https://deepmind.google.com/science/alphagenome/AlphaGenomeに関連するコードやドキュメントは以下のリンク先で公開されています。
GitHub - google-deepmind/alphagenome: This API provides programmatic access to the AlphaGenome model developed by Google DeepMind.
https://github.com/google-deepmind/alphagenome?tab=readme-ov-fileGoogleはAlphaGenomeを用いる研究者向けのコミュニティフォーラムも開設しています。
AlphaGenome
https://www.alphagenomecommunity.com/また、AlphaGenomeについて記した査読前論文が以下のリンク先で公開されています。
AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model
(PDFファイル)https://storage.googleapis.com/deepmind-media/papers/alphagenome.pdf・関連記事 Google DeepMind共同創設者のデミス・ハサビス氏らがノーベル化学賞を受賞、「AlphaFold」などタンパク質構造予測AIの研究が高く評価される - GIGAZINE
Googleの人工知能開発をリードするDeepMindの天才デミス・ハサビス氏とはどんな人物なのか? - GIGAZINE
Google DeepMindがAIですべての生命分子の構造と相互作用を予測できる「AlphaFold 3」をオープンソース化、科学的発見と創薬の加速へ - GIGAZINE
Google DeepMindがAI「AlphaMissense」を発表、どの遺伝子変異が有害かを予測して遺伝性疾患の原因を特定するのに役立つ可能性 - GIGAZINE