発話および言語関連のテクノロジーの進歩によって、音声検索、テキスト読み上げアプリ、音声認識、そして機械翻訳などのツールが誕生した。しかし、これらのツールは認識できるように訓練された言語に対してしか機能しない。典型的には英語、フランス語、または中国語などだ。数百万人のアフリカ人が話す多様な言語など、その他の多くの言語には依然として未対応なのだ。キャスリーン・シミニュ(28歳)は、この現状を変えたいと考えている。シミニュが立ち上げたフェローシップ・プログラムを通して、9つのアフリカの言語に関してオープンソースのデータセットが作成された。さまざまなな機械学習タスクで使用できるよう、注釈(アノテーション)も付けられている。シミニュは、「インターネット上で容易に入手できるですべての情報が、英語と同様にアフリカの言語でもアクセスできるかもしれない未来」を想像している。
- 人気の記事ランキング
- The Biggest Questions: Are we alone in the universe? 地球外生命体は存在するか? 人類の先入観を超えた探索
- Google DeepMind wants to define what counts as artificial general intelligence 汎用人工知能(AGI)とは何か? ディープマインドが定義を提案
- Text-to-image AI models can be tricked into generating disturbing images AIモデル、「脱獄プロンプト」で不適切な画像生成の新手法
- This mathematician is making sense of nature’s complexity 幾何学で世界の複雑さを理解する、異才数学者の型破りな方法論