グーグル、ニューラル・ネットで「ゲシュタルトの法則」を確認
人間は、不完全な対象を補間して完全なものとして知覚できる。人間の脳をモデルにしたニューラル・ネットワークにおいて、こうした心理学の法則は成立するのだろうか。グーグル・ブレインの研究チームが答えを出した。 by Emerging Technology from the arXiv2019.03.22
20世紀初頭にドイツの実験心理学者のグループは、人間の脳が予測不可能な混沌とした世界を意味ある世界として認識する方法に疑問を持ち始めた。そして、この疑問に答えるために「ゲシュタルト効果」という概念を発展させた。知覚を考えるとき、部分の集合体ではなく全体性に重点を置いて捉える考え方だ。
それ以来、心理学者たちは人間の脳が断片的な情報に基づいて全体像を知覚するのに著しく優れていることを発見してきた。その良い例が以下に示した図だ。脳は三角形や四角形などの2次元形状に加え、3次元の球体さえも知覚する。しかし、知覚した形状はどれも完全に描かれてない。脳が不完全な形状の欠落部分を埋めているのだ。
この研究は当然、ゲシュタルト効果がニューラル・ネットワークで起こるかという疑問に発展する。ニューラル・ネットワークは人間の脳をモデルにしている。実際、マシン・ビジョンの研究者たちは、開発した多層ニューラル・ネットワークが霊長類の脳の視覚系や人間の大脳皮質の一部に非常に似ていることがわかったとしている。
そこから興味深い疑問が導き出される。ニューラル・ネットワークは、人間と同様に、物体の一部を見るだけで物体全体を知覚できるのだろうか?
その答えを最近、グーグル・ブレイン(Google Brain)のビーン・キム博士の研究チームが発表した。カリフォルニア州マウンテンビューにある同社の人工知能(AI)部門のキム博士の研究チームは、人間向けに作られたゲシュタルト効果の実験を使って、さまざまなニューラル・ネットワークをテストした。その結果、機械が実際に、物体の一部分を観察して物体全体を知覚できるこ …
- 人気の記事ランキング
-
- Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
- Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
- Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
- Text-to-image AI models can be tricked into generating disturbing images AIモデル、「脱獄プロンプト」で不適切な画像生成の新手法
- What is the chance your plane will be hit by space debris? 空からゴミが降ってくる—— 衛星10万基時代のリスク、 航空への影響は?【解説】
