KADOKAWA Technology Review
×
発表!MITテクノロジーレビューが選ぶ
2022年のイノベーター14人。
【12/15 Summit開催】
Software Dreams Up New Molecules in Quest for Wonder Drugs

深層学習で創薬 ハーバード大学などが成果発表

機械学習システムによる膨大な医薬品データの取り込みが、人類に新たな可能性を示してくれる。 by Tom Simonite2016.11.04

アスピリンとイブプロフェンを組み合わせたらどうなるか。ハーバード大学のアラン・アスプル=グジック教授(化学)にもその答えはわからない。しかしアスプル=グジック教授は、この疑問に答えられるようにソフトウェアを訓練した。ソフトウェアは、両方の薬品の属性を兼ね備えた分子構造を示し、答えてくれるかもしれない。

この人工知能は新薬の研究に役立つかもしれない。 薬学研究は候補分子で満たされた巨大なプールを隈なく探索するため、ソフトウェアに頼りがちだ。こうしたソフトウェアは化学者によって書かれたルールと有用な構造を推測するためのシミュレーションによって動いているが、人間の思考にもシミュレーションの正確性にも制約があり、コンピューターの処理能力には限界がある。

アスプル=グジック教授のシステムは人間とは全く違ったやり方で、長たらしいシミュレーション抜きに分子構造を構想できる。機械学習アルゴリズムと何万種もの「薬らしい」分子のデータによって蓄えられた自らの知識経験を活用するのだ。

アスプル=グジック教授は「このシステムは、まるで化学者のように、自らが学んだ化学知識を使ってより直感的に研究します。この種のソフトウェアを助手として活用すれば、人間はより優れた化学者になれるかもしれません」という。アスプル=グジック教授はMIT Technology Reviewが2010年に発表したヤング・イノベーター・リストに選出されている。

新システムは深層学習と呼ばれる機械学習の手法で構築された。深層学習はコンピューター業界の企業では普及しているが、自然科学分野では実例が少ない。深層学習では、膨大な量のデータを取り込んで、学習結果から妥当なデータを新規に生成できる「生成モデル」という設計方式が使われている。

生成モデルは特に画像、音声、テキストの自動生成に用いられる。 たとえばグーグルのスマート・リプライは、生成モデルによってメールの返信を自動作成している。しかしアスプル=グジック教授とハーバード大、トロント大、ケンブリッジ大のチームは先月、生成モデルに25万種の薬らしい分子を学習させた結果を発表した。

このシステムは、既存の薬剤化合物の属性を組み合わせて新しく有望な化学構造を生成したり、溶解性や合成の容易さなど特定の属性を強く示す分子を示したりできるかもしれない。

ベンチャー・キャピタルのアンドレッセン・ホロウィッツのパートナーである、スタンフォード大学のビジェイ・パンデ教授(化学)によると、このプロジェクトは機械学習に関する新しいアイデアが科学研究を一変させるという、最近増えつつある事例のひとつだという (「米国防総省、人工知能企業と協業で乳がんの分子標的治療薬を開発」参照)。

パンデ教授によると、今回の事例には深層学習ソフトウェアが習得したある種の化学知識によって、科学者を補助できる可能性が示されている。

「この技術はかなり広範に応用できると思います。主だった薬剤候補の特定や最適化に役立つかもしれませんし、太陽光電池や触媒など、他のものにも応用できるかもしれません」

研究グループはすでに、ディスプレー技術で重要な有機LED分子のデータベースについて、システムを応用する実験をした。しかし、まったく意味をなさない化学構造が示されることもあるため、実用化には化学的スキルの改善が求められる。

パンデ教授によると、ソフトウェアに化学を学習させる上で困難なことのひとつは、化学構造を深層学習ソフトウェアに読み込ませる際にどのようなデータフォーマットが最適なのかがまだ特定できていないことだ。画像音声認識翻訳の分野で深層学習が人間に迫る性能を発揮していることからも明らかなように、画像、音声、テキストは深層学習に適していた。しかし、化学構造をコード化する既存の方法は、そうともいえないようなのだ。

アスプル=グジック教授のチームは、この問題について考えながら、システムが誤判定する頻度を下げる新機能を追加している。

アスプル=グジック教授はシステムの化学知識を広げるため、さらに大量のデータを学習させようとしている。そうすれば、何百万ものデータベース画像によって画像認識機能が実用化したのと同様、システムの性能はさらに高まるだろう。 アスプル=グジック教授は近いうちにアメリカ化学会のデータベースで記録・公開されている約1億件の化学構造すべてを、自身のAIプロクラムに学習させたいとしている。

人気の記事ランキング
  1. Here’s how a Twitter engineer says it will break in the coming weeks ツイッターで「非公式RT」が一時復活、崩壊の始まりか
  2. Former Twitter employees fear the platform might only last weeks 「ハードコア」大量離職で、元従業員らがツイッターに余命宣告
  3. We could run out of data to train AI language programs  大規模言語AIにアキレス腱、訓練用データが2026年にも枯渇か
  4. President Biden reveals the James Webb Space Telescope’s “poetic” first image of the universe ジェームズ・ウェッブ宇宙望遠鏡の最初の写真、130億年前の銀河も
トム サイモナイト [Tom Simonite]米国版 サンフランシスコ支局長
MIT Technology Reviewのサンフランシスコ支局長。アルゴリズムやインターネット、人間とコンピューターのインタラクションまで、ポテトチップスを頬ばりながら楽しんでいます。主に取材するのはシリコンバレー発の新しい考え方で、巨大なテック企業でもスタートアップでも大学の研究でも、どこで生まれたかは関係ありません。イギリスの小さな古い町生まれで、ケンブリッジ大学を卒業後、インペリアルカレッジロンドンを経て、ニュー・サイエンティスト誌でテクノロジーニュースの執筆と編集に5年間関わたった後、アメリカの西海岸にたどり着きました。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. Here’s how a Twitter engineer says it will break in the coming weeks ツイッターで「非公式RT」が一時復活、崩壊の始まりか
  2. Former Twitter employees fear the platform might only last weeks 「ハードコア」大量離職で、元従業員らがツイッターに余命宣告
  3. We could run out of data to train AI language programs  大規模言語AIにアキレス腱、訓練用データが2026年にも枯渇か
  4. President Biden reveals the James Webb Space Telescope’s “poetic” first image of the universe ジェームズ・ウェッブ宇宙望遠鏡の最初の写真、130億年前の銀河も
MITテクノロジーレビュー[日本版] Vol.8
MITテクノロジーレビュー[日本版] Vol.8脱炭素イノベーション

2050年のカーボンニュートラル(炭素中立)の実現に向けて、世界各国で研究開発が加速する脱炭素技術、社会実装が進む気候変動の緩和・適応策などGX(グリーン・トランスフォーメーション)の最新動向を丸ごと1冊取り上げる。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る