LLMの回答は「偽善」か? グーグルが道徳的推論のテストを提唱
LLMの倫理的助言は人間の専門家より「思慮深い」と評価される一方、選択肢のラベルを変えるだけで道徳的判断が逆転することも報告されている。グーグル・ディープマインドは、LLMの道徳的能力をコーディングや数学と同等の厳密さで評価する新たな研究分野を提唱した。 by Will Douglas Heaven2026.02.20
- この記事の3つのポイント
-
- グーグル・ディープマインドが大規模言語モデルの道徳的行動をコーディングや数学と同等の厳密さで評価すべきとの論文を発表
- LLMは道徳的能力を示すが質問形式で回答が変わるなど信頼性に課題があり、演技か真の推論かの判別が困難
- 異なる価値観への対応や非西洋道徳観の表現不足など、文化横断的な道徳的能力保証の技術的実現方法は未解決
グーグル・ディープマインド(Google DeepMind)は、大規模言語モデル(LLM)の道徳的行動――コンパニオン、セラピスト、医療アドバイザーなどとして振る舞うよう求められた際にどのような行動を取るのか――について、コーディングや数学の能力と同等の厳密さで精査すべきだと呼びかけている。
LLMが改良されるにつれ、人々はより多くの繊細な役割を担うよう求めるようになっている。エージェントは人々の代理として行動を開始している。LLMは人間の意思決定に影響を与えることができるかもしれない。しかし、この技術がそのようなタスクにおいて実際にどの程度信頼できるのかは、いまだ明らかではない。
コーディングや数学には、検証可能な明確な正解があると、グーグル・ディープマインドの研究科学者ウィリアム・アイザックは語った。これは、同社の研究科学者ジュリア・ハースとともに、2月18日にネイチャー誌に掲載された彼らの研究について独占プレビューを受けた際の発言である。これに対し、道徳的な問題には通常、受け入れ可能な答えの幅が存在する。「道徳性は重要な能力ですが、評価が難しい」とアイザックは言う。
「道徳の領域では、正しいも間違いもありません」とハースは付け加える。「しかし、決して何でもありというわけではありません。より良い答えもあれば、より悪い答えもあります」。
研究者らは複数の重要な課題を特定し、それらに対処する方法を提案している。しかし、それは既成の解決策というよりも、今後の研究課題の提示に近いものだ。「彼らは異なる視点をうまく統合している」と、ドイツのザールラント大学でLLMを研究するベラ・デンベルクは述べる。
人気コラムのアドバイスより優秀
多くの研究が、LLMが顕著な道徳的能力を示し得ることを報告している。昨年発表されたある研究では、米国の回答者が、オープンAI(OpenAI)のGPT-4oによる倫理的助言を、ニューヨーク・タイムズ紙の人気アドバイス欄「エシシスト」の(人間の)執筆者による助言よりも、より道徳的で、信頼でき、思慮深く、かつ正確であると評価したことが示された。
問題は、そのような行動が単なる演技――例えば記憶された応答の模倣――なのか、それともモデル内部で実際に何らかの道徳的推論がなされている証拠なのかを切り分けることが難しい点にある。言い換えれば、それは美徳そのものなのか、それとも美徳のシグナリングにすぎないのか、という問いである。
この問いは重要である。なぜなら、複数の研究がLLMの信頼性の低さも示しているからだ。まず、言語モデルは人を喜ばせようとしすぎる傾向がある。LLMに道徳的な質問を投げかけ、それについて返ってきた回答に反対や異議を唱えると、簡単に …
- 人気の記事ランキング
-
- This scientist rewarmed and studied pieces of his friend’s cryopreserved brain 10年冷凍保存の脳は「驚くほど良好」——蘇生は「まったく別の話」
- Future AI chips could be built on glass AIチップの熱問題、解決策は「ガラス」 年内に商業生産へ
- What do new nuclear reactors mean for waste? 新型原子炉が続々登場、核廃棄物管理の「手引き」は書き直せるか
- The Pentagon is planning for AI companies to train on classified data, defense official says 【独自】米国防総省、軍事機密データでAIモデルの訓練を計画