フラッシュ2023年7月25日
- 知性を宿す機械
東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開
by MITテクノロジーレビュー編集部 [MIT Technology Review Japan]東京大学発のスタートアップ企業であるLightblue(ライトブルー)は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープンソース・ソフトウェアとして公開した。ライセンスはApache 2.0。
この言語モデルは、米モザイクML (MosaicML)が公開した多言語大規模言語モデル「MPT-7B」を基にしたもの。グーグルが開発した多言語データセット「MC4」をアレン人工知能研究所(Allen Institute for AI)がそれぞれの言語ごとに利用可能にしたサブセットの日本語部分を使って追加学習した。
Lightblueは、今回公開したモデルを法人向けに提供する。業界用語や部署特有の専門用語、慣習などに合わせて訓練・調整することで、企業や部署によって異なる要望に応じるという。加えて、自社サービスの提供も予定しているとのことだ。
(笹田)
- 人気の記事ランキング
- What to know about this autumn’s covid vaccines 新型コロナに秋の流行の兆し、ワクチンの現状は?
- How new batteries could help your EV charge faster CATLの新型電池でEV充電高速に、10分で400キロ走行
- AI just beat a human test for creativity. What does that even mean? AIが創造性テストで人間に勝利、その衝撃結果が意味すること
- How water could make safer batteries 電解液に水、送電網向け「燃えない電池」開発が活発化
- This startup plans to power a tugboat with ammonia later this year 輸送産業の脱炭素化、「アンモニア」に賭けるMIT発ベンチャー