KADOKAWA Technology Review
×
ディープシークは省エネではない? 推論ブームで新たな懸念
Sarah Rogers / MITTR | Photo Getty
人工知能(AI) 無料会員限定
DeepSeek might not be such good news for energy after all

ディープシークは省エネではない? 推論ブームで新たな懸念

中国企業が開発した大規模言語モデル「DeepSeek-R1」が注目された理由の1つが、効率性にある。ただ、消費電力に限れば、必ずしも「省エネ」とは言えないことが分かった。 by James O'Donnell2025.02.06

この記事の3つのポイント
  1. DeepSeek-R1は訓練段階ではエネルギー効率が高い一方で推論段階では効率が低い
  2. R1の手法を他社が模倣することでAI全体の電力消費が増加する可能性がある
  3. 思考の連鎖モデルの普及によりAIのエネルギー効率改善の効果が相殺される恐れも
summarized by Claude 3

中国発のAIモデル「DeepSeek-R1(ディープシーク-R1)」が話題を独占している。さまざまな業界関係者が多種多様な講評を残しているが、正確さはまちまちだ。このモデルが個人データを収集しているという話(その可能性はある)、これまでのAIの常識を覆すという話(結論を出すにはまだ早いが、本誌のウィル・ダグラス・ヘブン編集者による解説記事は必読)、そしてDeepSeek-R1の斬新で効率的な手法により、現状のAIが消費する大量の電力は必然ではないことが示されたという話などが飛び交っている。

このうち、最後の主張は誤解を招くものである。その理由が、MITテクノロジーレビューに新たに提供されたデータから明らかになった。この初期データは、DeepSeek-R1の小規模モデルのひとつに少数のプロンプト(指示テキスト)を与えた結果に基づいており、同程度の規模を持つメタ(Meta)のモデルと比較して、回答生成時により多くの電力を消費する可能性を示している。DeepSeek-R1の課題は、訓練段階ではエネルギーを節約できるものの、質問への回答時にはより多くのエネルギーを消費し、さらに生成される回答が長くなる傾向がある点である。

さらに、DeepSeek-R1の手法に触発された他のテクノロジー企業が、同様の低コスト推論(reasoning)モデルの開発に乗り出す可能性があることから、AI全体の電力消費に対する見通しはすでに楽観的とは言いがたい状況になっている。

大規模言語モデル(LLM)の処理は大きく2つの段階に分けられる。訓練と推論(inference)だ。訓練は数カ月に及ぶプロセスで、この段階でモデルはデータから学習する。その後、世界中の人々がモデルに何かを質問するたびに実行されるのが推論である。これらの処理はいずれも通常、データセンターで実行され、チップの稼働やサーバーの冷却に大量の電力を消費する。

DeepSeek-R1の訓練段階について、開発チームは「専門家の混合(MoE:Mixture of Experts)」と呼ばれる手法を改良し、訓練段階の特定の時点で数百億あるパラメーター(より良い答えを生成するためにモデルが利用する「つまみ」)のうちの一部だけを使用するようにした。さらに特筆すべきは、強化学習の手法も改良し、モデルが出力した内容を評価して、回答のさらなる改善に利用するようにしたことである。これには通常、人力によるアノテーションが利用されるが、DeepSeek-R1の開発チームはそのプロセスの自動化に成功した。

訓練の効率を上げる手法の登場は、AI企業各社がモデルの性能を一定水準に引き上げるまでに消費する電力を節約できることを意味するように思える。しかし、現実にはそううまくはいかない。

「より賢いシステムを実現することが最優先」となるため、「企業はモデルの訓練にかける投資を減らすのではなく、むしろ増やすようになります」。アンソロピック(Anthropic)の共同創業者で最高経営責任者(CEO)を務めるダリオ・アモデイは自身のブログでこう指摘している。企業が投資に対して多くの見返りを得られるようになれば、さらに投資する価値があるとみなされ、結果としてさらに多くの電力が消費されることになるのだ。「コスト効率の恩恵はすべて、より賢いモデルの訓練に費やされることになり、この流れに歯止めがかかるのは企業の資金力が限界に達したときだけで …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. An ancient man’s remains were hacked apart and kept in a garage 切り刻まれた古代人、破壊的発掘から保存重視へと変わる考古学
  2. This startup just hit a big milestone for green steel production グリーン鉄鋼、商業化へ前進 ボストン・メタルが1トンの製造に成功
  3. AI reasoning models can cheat to win chess games 最新AIモデル、勝つためなら手段選ばず チェス対局で明らかに
  4. OpenAI has released its first research into how using ChatGPT affects people’s emotional wellbeing チャットGPTとの対話で孤独は深まる? オープンAIとMITが研究
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る