Mozilla 宣布它正在使其眾包項(xiàng)目 Common Voice 支持更多語言。Common Voice 是一個(gè)旨在創(chuàng)建開源語音識(shí)別數(shù)據(jù)集的項(xiàng)目,于去年6月發(fā)布,它邀請來自世界各地的志愿者通過網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序,用他們的聲音記錄文本片段。
業(yè)內(nèi)普遍認(rèn)為語音將成為下一個(gè)重要的技術(shù)平臺(tái),近年來隨著人工智能理論與技術(shù)的迅猛發(fā)展,語音識(shí)別技術(shù)在不斷突破,通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語音數(shù)據(jù)歸為公司自己所有,這些數(shù)據(jù)的價(jià)值或許目前很難被外界看出來,但是在信息化高度發(fā)達(dá),特別是今天這樣一個(gè)大數(shù)據(jù)和人工智能時(shí)代,為開發(fā)機(jī)器學(xué)習(xí)模型提供語音數(shù)據(jù)集怎么看都是一件有深遠(yuǎn)意義的事,這些語音數(shù)據(jù)的意義會(huì)慢慢體現(xiàn)。
而最終當(dāng)它們的價(jià)值逐漸顯現(xiàn),人們會(huì)發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語音技術(shù)的命門,主導(dǎo)了這場語音市場之爭。
Common Voice 項(xiàng)目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語音數(shù)據(jù)集開源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來將語音識(shí)別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語數(shù)據(jù)集的第一批成果,其中收錄了20000個(gè)人錄制的40萬個(gè)錄音、大約500小時(shí)的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數(shù)據(jù),同時(shí)也在為收集另外40種語言做準(zhǔn)備,巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經(jīng)準(zhǔn)備好啟動(dòng)眾包語音數(shù)據(jù)收集。
Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語言甚至方言的時(shí)候是可以被機(jī)器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門員一樣來完全把控語音服務(wù)。”
Common Voice 項(xiàng)目的意義與用于打擊私人平臺(tái)的開放許可證項(xiàng)目類似,OpenStreetMap 就是一個(gè)很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖,使得開發(fā)商不再需要依賴于 Google Maps 這樣的競爭對手,不僅降低了成本開銷,技術(shù)上也不再受到限制。
“使用多種語言標(biāo)志著 Common Voice 邁出了重要的一步,我們希望它對整體語音技術(shù)來說也是一大步”,Mozilla Common Voice 項(xiàng)目的數(shù)字策略師 Michael Henretty 補(bǔ)充到:“語音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,也會(huì)讓人們獲取信息更加便捷。”
-
Mozilla
+關(guān)注
關(guān)注
0文章
50瀏覽量
11420 -
語音識(shí)別
+關(guān)注
關(guān)注
39文章
1779瀏覽量
114125
原文標(biāo)題:打破語音壟斷 Mozilla Common Voice 支持更多語言
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
芯資訊|WT2003HP8-32N(A20)語音芯片:賦能換電柜智能語音交互與遠(yuǎn)程升級(jí)新體驗(yàn)

離線語音識(shí)別芯片方案商:茶吧機(jī)語音控制模塊NRK3502

98%識(shí)別率!語音+觸摸方案,讓衛(wèi)浴操控一步到位!

Meta與UNESCO合作推動(dòng)多語言AI發(fā)展
微軟Copilot Voice升級(jí),積極拓展多語言支持
燃?xì)鈾z測儀語音報(bào)警方案——NV128H語音芯片

語音識(shí)別與自然語言處理的關(guān)系
ASR與傳統(tǒng)語音識(shí)別的區(qū)別
車載空氣凈化器語音芯片方案

語音IC方案,在交通信號(hào)燈語音提示器的應(yīng)用解析,NV040D

語音開關(guān)控制器方案,全屋開關(guān)變“聲控”

N9300-S16語音芯片:提升電梯播報(bào)體驗(yàn),實(shí)現(xiàn)導(dǎo)航聲音播報(bào)提示

評(píng)論