KADOKAWA Technology Review
×
12/16開催 「再考ゲーミフィケーション」イベント参加受付中!
ディープマインド、改良型強化学習AIと脳の類似をマウスで確認
Wikimedia Commons
人工知能(AI) Insider Online限定
An algorithm that learns through rewards may show how our brain does too

ディープマインド、改良型強化学習AIと脳の類似をマウスで確認

グーグルのAI子会社であるディープマインドは、改良した強化学習アルゴリズムが、ドーパミンが脳の学習を手助けする際の神経細胞の振る舞いと一致することを示す研究を発表した。この結果は、AI研究の現在の方向性が正しいことを示すと同時に、神経科学の研究者に新たな知見を与えてくれるだろう。 by Karen Hao2020.01.23

1951年、当時ハーバード大学の学生だったマービン・ミンスキーは、動物の行動の観察からアイデアを得てインテリジェントマシンの設計を試みた。動物が罰と報酬を通じて学習する仕組みを犬を用いて示した生理学者イワン・パブロフの有名な実験を参考にして、それと同様の強化を通じて継続的に学習し、仮想の迷路を解くことができるコンピューターを開発したのだ。

当時の神経科学者は、動物が罰と報酬を通じて学習することを可能にする脳内のメカニズムをまだ解明できていなかった。だが、それでもミンスキーは動物の行動を大まかに模倣して人工知能(AI)を進化させることができた。その数十年後、強化学習は進化し続け、今度は神経科学の分野における強化学習メカニズムの発見を手助けし、2つの分野で進歩の好循環が生まれた。

1月15日にネイチャー誌に掲載された論文によると、アルファベット(グーグル)のAI関連子会社であるディープマインド(DeepMind)は、再び強化学習の知見を利用して、人間の脳内の報酬メカニズムに関する新しい理論を提唱した。初期の実験結果によって裏付けられたこの仮説により、メンタルヘルスやモチベーションに関する理解が深まるだろう。さらに、より人間に近い汎用人工知能の構築を目指しているAI研究の現在の方向が正しいことを実証するかもしれない。

大まかに言えば、強化学習はパブロフの犬から導かれた洞察に従っている。つまり、正のフィードバックと負のフィードバックのみを通じて、複雑な新しいタスクを習得するようエージェントに指示できるという洞察だ。強化学習のアルゴリズムは、どの行動が報酬をもたらす可能性があるかをランダムに予測することによって割り当てられたタスクの学習を開始する。次に、行動を実行し、実際の報酬を観察して、誤差の大きさに基づいて予測を調整する。数百万回あるいは数十億回と試行を重ねるうちにアルゴリズムの予測誤差はゼロに収束する。その時点でアルゴリズムは、どの行動を取れば報酬が最大化し、タスクを完了できるかを正確に理解しているという仕組みだ。

脳の報酬システムもほぼ同じ方法で機能することが分かっている。それは1990年代に強化学習アルゴリズムにヒントを得て発見された。人間または動物が行動を起こ …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. 3 things that didn’t make the 10 Breakthrough Technologies of 2025 list 2025年版「世界を変える10大技術」から漏れた候補3つ
  2. OpenAI’s new defense contract completes its military pivot オープンAIが防衛進出、「軍事利用禁止」から一転
▼Promotion 再考 ゲーミフィケーション
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る