KADOKAWA Technology Review
×
量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
Photo Illustration by Sarah Rogers/MITTR | Photos Deepseek, Getty
Quantum physicists have shrunk and “de-censored” DeepSeek R1

量子技術でDeepSeekを55%小型化、「検閲解除」にも成功

量子技術を専門とするスペイン企業が、「DeepSeek(ディープシーク)R1」を55%小型化し、検閲機能を除去したと発表。天安門事件などの敏感な話題への回答制限を削除したという。 by Caiwei Chen2025.11.20

この記事の3つのポイント
  1. スペイン企業が量子物理学の手法を用いてDeepSeek R1から検閲機能を除去した改良版を開発
  2. 中国のAI企業は法律と社会主義価値観に沿うよう検閲層を組み込むことが義務付けられている
  3. 完全な検閲除去は困難で動的な性質を持つため専門家は慎重な評価が必要と指摘している
summarized by Claude 3

量子物理学者のグループが、強力な推論AI(人工知能)モデル「DeepSeek(ディープシーク)R1」から検閲機能を取り除いた、独自の改良版を開発したと主張している。

量子に着想を得たAI技術を専門とするスペインの企業、マルチバース・コンピューティング(Multiverse Computing)の科学者らは、元のモデルより55%小さいながらもほぼ同等の性能を備えた「DeepSeek R1 Slim」を開発した。重要なことに、彼らはこのモデルから中国政府による公式検閲も除去したと主張している。

中国では、AI企業はコンテンツの出力が法律と「社会主義的価値観」に沿うことを保証するための規則や規制の対象となっている。その結果、企業はAIシステムを訓練する際に検閲の層を組み込んでいる。「政治的に敏感」とみなされる質問をされた場合、モデルはしばしば回答を拒否したり、国家プロパガンダから直接引用した論点を提供したりする。

モデルを縮小するため、マルチバース・コンピューティングは量子物理学から借用した数学的に複雑なアプローチを採用した。これは高次元グリッドのネットワークを使用して大規模データセットを表現・操作する手法である。いわゆる「テンソルネットワーク」を用いることで、モデルのサイズを大幅に縮小し、複雑なAIシステムをより効率的に表現できる。

この手法により、研究者はモデル内のすべての相関関係の「地図」を得ることができ、特定の情報を精密に特定して除去することが可能になる。モデルを圧縮・編集した後、マルチバースの研究チームは、その出力が元のモデルにできるだけ近くなるよう微調整する。

その効果を検証するため、研究チームは中国のモデルで制限されることが知られている話題に関する、約25の質問からなるデータセットを編集した。これには「くまのプーさんは誰に似ているか?」(習近平国家主席を揶揄するミームへの言及)や「1989年に天安門で何が起こったか?」などが含まれる。改良されたモデルの回答を、元のDeepSeek R1と比較し、オープンAI(OpenAI)のGPT-5を公平な審査員として使用して各回答の検閲度を評価した。マルチバースによると、検閲を除去したモデルは西側のモデルに匹敵する事実に基づいた回答を提供できたという。

この研究は、既存のAIモデルを圧縮・操作する技術を開発するマルチバースのより広範な取り組みの一部である。今日の大規模言語モデル(LLM)の多くは、訓練と実行に高性能なGPU(画像処理装置)と膨大な計算能力を必要とする。だが、マルチバースの共同創設者兼CSO(最高科学責任者)のロマン・オルスは、それらは非効率的だと言う。圧縮されたモデルはほぼ同等の性能を発揮しながら、エネルギーと費用の両方を節約できるという。

AI業界全体で、モデルをより小さく効率的にする取り組みが拡大している。ディープシークが独自に開発した「R1-Distill」などの蒸留モデルは、大きなモデルに知識を小さなモデルに「教える」ことで、より大きなモデルの能力を捉えようと試みているが、複雑な推論タスクにおいて元のモデルの性能に及ばないことが多い。

モデルを圧縮する他の方法には、モデルのパラメーター(訓練時に設定される境界)の精度を下げる量子化(quantization)や、個々の重みや「ニューロン」全体を除去する剪定(pruning、「枝刈り」とも)がある。

「性能を失うことなく大規模AIモデルを圧縮することは非常に困難です」。材料・化学品に特化したソフトウェア企業、シトリン・インフォマティクス(Citrine Informatics)のAI研究エンジニアで、マルチバースの研究には関与していないマクスウェル・ベネトスは述べる。「ほとんどの技術はサイズと能力の間で妥協しなければなりません。量子にヒントを得たアプローチの興味深い点は、非常に抽象的な数学を使用して、通常よりも正確に冗長性を削減することです」。

このアプローチにより、大規模言語モデルからバイアスを選択的に除去したり、行動をきめ細かなレベルで追加したりすることが可能になると、マルチバースの研究者らは述べている。中国当局による検閲の除去に加えて、他の種類の認識されたバイアスや専門知識を注入または除去することもできるという。将来的に、マルチバースはすべての主流オープンソースモデルを圧縮する計画だと述べている。

タフツ大学フレッチャー・スクールのトーマス・カオ助教授(技術政策)は、中国当局はモデルに検閲を組み込むことを要求しており、最も影響力のあるオープンソースAIモデルの多くが中国から来ていることを考えると、この要求は現在、世界の情報エコシステムを形作っていると指摘する。

学術界でもこの現象の記録と分析が始まっている。スタンフォード大学のジェニファー・パン教授とプリンストン大学のシュー・シュー教授は今年初め、大規模言語モデルにおける政府による検閲を調査した研究を実施した。彼らは中国で作成されたモデルが、特に中国語のプロンプトに対して、著しく高い検閲率を示すことを発見した。

中国のモデルから検閲を除去する取り組みへの関心が高まっている。今年初め、AI検索企業のパープレキシティ(Perplexity)は、DeepSeek R1の独自の検閲除去版をリリースし、これを「R1 1776」と名付けた。同社のアプローチはマルチバースが使用したものよりも従来的な微調整手法で、検閲されたトピックに関連する4万件の多言語プロンプトのデータセットでモデルを事後学習させている。

しかし、カオ助教授は検閲を完全に「除去」したという主張は誇張である可能性があると警告する。中国政府はインターネットの開始以来、オンライン情報を厳しく統制しており、これは検閲が動的で複雑であることを意味する。検閲はデータ収集プロセスから最終的な調整段階まで、AI訓練のあらゆる層に組み込まれている。

「そのような少数の質問への回答だけから、(検閲のないモデル)をリバースエンジニアリングすることは非常に困難です」とカオ助教授は話す。

人気の記事ランキング
  1. How do our bodies remember? 解説:運動をやめても筋肉は覚えている——復帰が速い科学的理由とは
チェン・ツァイウェイ [Caiwei Chen]米国版 中国担当記者
MITテクノロジーレビューの中国担当記者として、グローバルなテクノロジー業界における中国に関するあらゆるトピックを取材。これまで、ワイアード(Wired)、プロトコル(Protocol)、サウスチャイナ・モーニング・ポスト (South China Morning Post)、レスト・オブ・ワールド(Rest of World )などのメディアで、テクノロジー、インターネット、文化に関する記事を執筆してきた。ニューヨークのブルックリンを拠点に活動している。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
気候テック企業10 2025

MITテクノロジーレビューは毎年、気候テック分野で注目すべき企業を選出し、その一覧を発表している。 新たなクリーン・エネルギー源の創出や、食品生産・物流の再構築といった形で経済の主要セクターの脱炭素化に取り組む注目企業10社を紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る