フラッシュ2023年5月17日
-
サイバーエージェントが大規模言語モデルを公開、商業利用も可能
by MITテクノロジーレビュー編集部 [MIT Technology Review Japan]サイバーエージェントは2023年5月17日、最大68億パラメータの日本語大規模言語モデル(LLM:Large Language Model)を、機械学習プラットフォーム「ハギング・フェイス・ハブ(Hugging Face Hub)」で一般公開した。商用利用可能な「CC BY-SA 4.0ライセンス」で提供しており、同モデルをベースとしてチューニングをすることにより、対話型人工知能(AI)などの開発が可能となる。
同社は、ウィキペディア(Wikipedia)およびコモン・クロール(Common Crawl)のオープンな日本語データを用いて同モデルを訓練している。既存の大規模言語モデルのほとんどは英語を中心に学習されており、現状では日本語および日本文化に強いLLMは少ないという。今回の大規模言語モデルは、現時点では日本国内における公開モデルにおいて最大級の規模であり、大規模な日本語データを活かした独自モデルを開発したことで、従来より自然な日本語の文章生成が可能になるとしている。
今回の発表に先立ってサイバーエージェントは、130億パラメーターまでの大規模言語モデルの開発を完了したことを5月11日に発表。同社の「極予測AI」「極予測TD」「極予測LP」などAIを活用した広告クリエイティブ制作領域のサービスにおいて活用を始めている。
(中條)
-
- 人気の記事ランキング
-
- It’s time to address the looming crisis in entry-level work. 「コーディングを学べ」もう通用せず、AIが若者の雇用を奪い始めた
- Promotion Call for entries for Innovators Under 35 Japan 2026 「Innovators Under 35 Japan」2026年度候補者募集のお知らせ
- China has approved the world’s first invasive brain-computer chip—here’s what’s next 中国、BCIを国家戦略に 世界初の商用化で イーロン・マスクにも先行
- Anthropic’s Code with Claude showed off coding’s future—whether you like it or not 「Claudeに任せてしまおう」 たった1年で激変したソフトウェア開発
- A reality check on the AI jobs hysteria 「ホワイトカラー消滅」 まだデータに兆候なし ——ただし若者に警戒信号
