Categories: 未分類

Common Voice

Common_Voice

Common Voiceは、音声認識ソフトウェア用の無料データベースを作成するためにMozillaによって開始されたクラウドソーシングプロジェクトです。このプロジェクトは、マイクを使ってサンプル文を録音し、他のユーザーの録音を確認するボランティアによってサポートされています。書き起こされた文章は、パブリックドメインライセンスCC0の下で利用可能な音声データベースに収集されます。このライセンスにより、開発者は制限やコストをかけずに音声からテキストへのアプリケーションにデータベースを使用できるようになります。 Common Voice 開発者 Mozilla Foundation 初回リリース
2017年6月19日; 4年前 (2017-06-19)
リポジトリ
https://github.com/mozilla/voice-web
で利用可能
多言語(言語のリスト)
ライセンス
クリエイティブコモンズCC0
Webサイト
commonvoice.mozilla.org

コンテンツ
1 目的
2 音声データベース
3 も参照してください
4 参考文献

目的
Common Voiceは、多様な音声サンプルを提供することを目的としています。MozillaのKatharinaBorchertによると、多くの既存のプロジェクトは、公共ラジオからデータセットを取得するか、そうでなければ、女性とはっきりとしたアクセントを持つ人々の両方を過小評価するデータセットを持っていました。

音声データベース
最初のデータセットは2017年11月にリリースされました。世界中で20,000人以上のユーザーが、500時間の英語の文章を記録しました。
2019年2月に、言語の最初のバッチが使用できるようにリリースされました。これには、英語、フランス語、ドイツ語、中国語の18の言語が含まれていましたが、ウェールズ語やカビル語のようにあまり普及していない言語も含まれていました。合計すると、これには42,000人を超える寄稿者からの約1,400時間の録音された音声データが含まれます。
2020年7月の時点で、データベースには54の言語で7,226時間の音声録音が蓄積されており、そのうち5,591時間はボランティアによって検証されています。
2021年5月、ルワンダ語を追加する作業に続いて、彼らはスワヒリ語を追加するための助成金を受け取りました。

も参照してくださいForvo Lingua Libre
クラウドソース(アプリ)

参考文献
^ 「なぜ私たちはAIを性別するのですか?音声技術企業はより包括的になるように動きます」。ガーディアン。2020年1月11日。
^ 「Mozillaのオープンソース音声認識モデルと音声データセットの初期リリースの発表」。ブログmozilla.org。2017年11月29日。
^ 「Mozillaは18の言語で1,400時間の音声でCommonVoiceデータセットを更新します」。VentureBeat。2019年2月28日。
^ 「MozillaCommonVoiceのアップデートは、音声ベースのWebブラウジングのための「HeyFirefox」ウェイクワードのトレーニングに役立ちます」。VentureBeat。2020年7月1日。 2021年3月10日のオリジナルからアーカイブ。
^ 「MozillaCommonVoiceは、東アフリカのVoiceTechを民主化および多様化するために340万ドルの投資を受けています」。MozillaFoundation。2021-05-25 。2021-06-03を取得。

「https://en.wikipedia.org/w/index.php?title=Common_Voice&oldid=1048667959」
から取得”

admin

Share
Published by
admin

Recent Posts

共通アクセスカード

Common_Access_C…

2週間 ago

一般的な芸術

Common_ARTS Com…

2週間 ago

コモン(ラッパー)

Common_(rapper)…

2週間 ago

一般的な(典礼)

Common_(liturgy…

2週間 ago

コモン(馬)

Common_(horse) …

2週間 ago

コモン(フィルム)

Common_(film) C…

2週間 ago