生成AIの進展と普及によって、SNSなどで流通する偽情報や誤情報が急増し、その真偽を迅速に検証する必要性が高まっている。しかし、従来のファクトチェックは証拠収集から検証、根拠整理まで時間と専門性を要し、拡散速度に追いつけない。また、偽情報を自動検知する技術も存在するものの、対象がテキストや画像など特定のメディアや改変手法に限られており、新種の偽造や複数メディアにまたがる偽情報には無力だった。
NECセキュアシステムプラットフォーム研究所の特別研究員である柿崎和也が取り組むのが、テキスト・画像・動画・音声といった複数のメディアを組み合わせたマルチモーダルなファクトチェック・システムである。NECは総務省「インターネット上の偽・誤情報対策技術の開発・実証事業(令和6年度)」に採択され、柿崎はPJメンバーとして、主導的な役割を果たした。
柿崎のシステムの核心は、「全モダリティのテキスト化」にある。画像キャプション生成、動画内容分析、音声文字起こしなどの機械学習モジュールにより、画像や動画、音声の内容をテキストデータとして抽出・記述する。次に、生成されたテキスト群を大規模言語モデル(LLM)が分析し、コンテンツの主張内容を整理・抽出。主張の真偽を確かめるための証拠をWebから検索・収集し、内容の整合性を評価する。併せて、顔ディープフェイク検知器など複数の機械学習モジュールを組み合わせて、検証対象コンテンツの加工・生成の有無を判定。最終的に判定結果と根拠を整理したレポートを自動生成する。
「テキスト化により、テキスト・画像・動画・音声のどの組み合わせでも検証できる汎用性を実現した。また、機械学習モジュールを差し替え・追加するだけで、新種の生成手法にも迅速に対応できる拡張性・保守性も備えている」と柿崎は説明する。
実務者参加型の実証実験では、証拠情報の収集作業を劇的に効率化し、産業界での実用性を実証した。複数のメディア機関へのヒアリングでも、実務への適合性が確認されている。また、本アイデアを紹介した論文がAAAI 2025のデモンストレーション・プログラムで採択されるなど、学術界でも評価されている。
将来的には、SNSや検索サービス、放送システムなど主要プラットフォームとAPI連携し、コンテンツ投稿・配信時にリアルタイムで真偽判定結果を付与する常時稼働型基盤への発展を目指す。
(畑邊康浩)
- 人気の記事ランキング
-
- This scientist rewarmed and studied pieces of his friend’s cryopreserved brain 10年冷凍保存の脳は「驚くほど良好」——蘇生は「まったく別の話」
- Future AI chips could be built on glass AIチップの熱問題、解決策は「ガラス」 年内に商業生産へ
- What do new nuclear reactors mean for waste? 新型原子炉が続々登場、核廃棄物管理の「手引き」は書き直せるか
- The Pentagon is planning for AI companies to train on classified data, defense official says 【独自】米国防総省、軍事機密データでAIモデルの訓練を計画