AIでノーベル化学賞を受賞したデミス・ハサビス氏のスピーチ : 読売新聞

(抜粋)  “So, what then makes for a suitable problem for these kind of AI methods to tackle? We look for kind of three criteria that make a problem suitable.  “No. 1, finding a path through a massively combinatorial search base. Can the problem be couched in these terms?  “Secondly, can we specify a clear objective function or metric to optimize, or hill climb against? So, in games, this is pretty easy: It’s winning the game or maximizing the score.  “And then thirdly, are there a lot of data available to learn the neural network model?”
(和訳)  では、このような人工知能の手法で取り組むのに適した問題とは何でしょうか。適しているかどうかを見極めるための基準が三つあります。  一つ目は、膨大な組み合わせ探索で(解決)方法を見つけられるか。問題はこの言葉で説明できるか。  二つ目に、答えを見つける作業を最適化したり、よりよい手法を探したりするために、明確な手法や指標をきちんと設定できるかどうか。ゲームなら結構簡単です。勝つか得点を最大化することです。  そして三つ目に、(脳の仕組みを模した)ニューラルネットワークモデルを学習するための大量のデータが手に入るかどうかです。

3つの共通する基準

 AI開発で昨年のノーベル化学賞に選ばれた英グーグル・ディープマインド社の最高経営責任者デミス・ハサビス(Demis Hassabis)氏の受賞スピーチは、本題であるAIの科学への応用に入る。

 対象を選ぶために考慮した点を、ハサビス氏は簡潔に3点に絞る。

 A make for B はAがBのような状況を引き起こしたり、誘導したりすることを意味する。for は方向や到達点を示すと、米国出身の同僚は解説してくれた。例えば The warm weather makes for good cherry blossom viewing.(暖かい天気は桜の花見にちょうどいい)といった具合だ。

 criteria は厳密には複数形で、単数形は criterion だ。ギリシャ語が語源で、単複の形もそれを引き継ぐ。

 objective function(最適解を得るための計算手法)や hill climbing(多くの候補から最良の解法を選び出す作業)など、次第に専門用語が増えてくるが、ゲームの例えを使い、話をわかりやすくする工夫がうかがわれる。

 さて、この3条件を満たすのがたんばく質の構造解析で、実は昔から関心があったという。

 “For me, the No. 1 thing I always wanted to do with these kinds of systems was protein folding. It was always top of my list ever since I first came across it … as an undergraduate at Cambridge.”  (私がこのようなシステムで一番にやりたかったことは、たんぱく質の折りたたみの仕組みです。ケンブリッジ大の学部生時代にこの魅力的な問題を初めて見て以来、最もやりたいことでした)

 undergraduate は大学院(graduate)の下、つまり学士課程を指す。

(抜粋)  “As you heard earlier, proteins are the building blocks of life. Almost all biological processes in every living thing depend on proteins for their operation, from the twitching of your muscle fibers to the firing of your neurons.  “So, in essence, you can think of proteins as these kinds of exquisite nanoscale bio machines. …  “Proteins are specified by their amino acid sequence, which you can see an example of … here on the left. And these sequences fold up into complex 3D structures.”
(和訳)  お聞きの通り、たんぱく質は生命の構成要素です。筋肉繊維の収縮から神経細胞に信号を伝えることまで、生命体のほぼ全ての生物学的な働きは、たんぱく質に依存しています。  つまり、たんぱく質とはナノサイズの精巧な生命機械のようだと考えられます。(中略)  左図のように、たんぱく質はアミノ酸の配列により種類や働きが決まります。この配列は折りたたまれて、複雑な立体構造になります。

全体から細部へ

Demis Hassabis, one of the three laureates awarded the Nobel Prize in Chemistry 2024, speaks during his lecture in Stockholm on Dec. 8. (Reuters file photo)

 たんぱく質とは何か。ハサビス氏はスライドも使い説明する。まず、たんぱく質は体を作るブロックだと大まかに表現し、次に役割を簡単に説明する。その後、細部の構造に移る。顕微鏡の倍率を上げていくようで、見事な説明の仕方だと感じる。

 building block は、建物を造るレンガやコンクリートブロックを思い浮かべよう。そのブロックを作る多数のアミノ酸の鎖は、雑然と折り重なるのではなく、熱による振動などで決まった形に収まる。それを予測し、実験で確かめるのは大変な手間がかかると説明する。

 “There are maybe up to 10 to the power of 300 possible conformations that protein can take: a truly astronomical number. So, obviously, enumerating all of these possibilities would take longer than the age of the universe. And yet, somehow, in nature, these proteins fold spontaneously, sometimes in a matter of milliseconds.”  (たんぱく質が取り得る構造は、おそらく10の300乗通りにも及ぶ可能性があり、まさに天文学的な数です。したがって、それを全て挙げるのには、宇宙の年齢よりも長い時間がかかるのは明らかです。しかし自然界では、これらのたんぱく質は自然に、時に1000分の1秒ほどで折りたたまれるのです)

 enumerate は「外に」の ex- を表す e と、「数える」を意味する numerate からなる。単に数えるのではなく、個々の内容を調べることも含む。リストにするような感覚だが、「列挙」という語が使えると、日本語も堪能な同僚は指摘してくれた。

 yet は接続詞で、 「それにも関わらず」の意味。また、spontaneously は automatically や by itself などと言い換えることができる。公式の改まった場なので難しい言葉が出てくるが、聞いて分かるようにしたい。

 ハサビス氏はたんぱく質の立体構造を高精度に予測するAIモデル「アルファフォールド」の開発でノーベル賞を受賞した。実用には原子1個の大きさ以下の精度(accuracy down to within the width of an atom)が必要とされる条件に開発は困難を極めたが、ついに成功する。詳細は省くが、その要因の一つを次のように述べた。

 “The AlphaFold team was a multidisciplinary team composed of expert biologists and chemists as well as machine learning and engineering.”  (アルファフォールドの開発チームには、生物学や化学、機械学習や工学といった様々な分野の専門家がいました。

 dicipline は研究分野で、異分野間の連携は今や研究や開発で欠かせない。ハサビス氏の仕事はその典型と言える。  (編集委員嘱託・吉田典之)

 この記事は、2025年4月11日の英字新聞「 ジャパン・ニューズ 」に掲載されました。

関連記事: