フラッシュ2022年7月16日
マルチエージェント環境でのモデル学習を安定化=電通大とCA
by MITテクノロジーレビュー編集部 [MIT Technology Review Japan]電気通信大学とサイバーエージェントの研究グループは、複数のモデルに学習させる「マルチエージェント」環境において、それぞれのモデルが同じ最適解に近づくようにできる新手法を開発した。
マルチエージェントで複数のモデルに学習させるときには、それぞれ独立に学習させる方法を採ることが多い。しかし、この方法では、複数のモデルの学習結果が最適な解に収束せず、周期的な軌道に陥ってしまう問題が発生する。
そこで研究グループは、特定の方向への学習を促進させる「突然変異」を加える手法を考案した。これによって、マルチエージェントでのモデル学習が周期的な軌道に陥ることなく、最適解の近傍に安定して収束するようになった。
研究成果は、2022年8月に開催される機械学習分野の国際会議UAI (Conference on Uncertainty in Artificial Intelligence)2022で発表する予定。サイバーエージェントは同社の広告配信などに活用していく考えだ。
(笹田)
- 人気の記事ランキング
- Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
- How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
- Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
- This US startup makes a crucial chip material and is taking on a Japanese giant 知られざる半導体材料の巨人 「味の素」の牙城を狙う 米スタートアップの勝算