本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。
美國研究公司Strategy Analytics近日發(fā)布了《2018年第三季度全球智能音箱市場報告》。報告顯示,全球智能音箱出貨量第三季度達到2270萬,同比增長197%,創(chuàng)歷史新高。亞馬遜在第三季度依然市場占有率最高,占據(jù)了32%的份額,谷歌以23%的份額緊追其后。百度的加入改變了全球智能音箱的市場格局,市場占有率猛增至8%,進入全球前四名。
“據(jù)IDC統(tǒng)計,2018年第三季度,搭載百度DuerOS的智能音箱在中國市場出貨量第一名,小度系列智能硬件在中國市場增速最快,市場份額增至24%。百度在遠(yuǎn)場語音技術(shù)上有很大的突破。我們和Duer OS生態(tài)一起發(fā)展,上周Duer OS產(chǎn)品的出貨量突破2億。這與百度遠(yuǎn)場語音技術(shù)的突破是密切相關(guān)的。“百度語音部門負(fù)責(zé)人在1月16日深圳舉辦的百度大腦硬件及平臺發(fā)布會現(xiàn)場表示。
遠(yuǎn)場語音技術(shù)三大關(guān)鍵點
2017年年初,各家開發(fā)廠商針對遠(yuǎn)場語音技術(shù)進行軍備競賽,智能音箱的市場大戰(zhàn),從2017年開始到現(xiàn)在,是從近場語音技術(shù)到遠(yuǎn)場語音技術(shù)的過度階段,廠商會介紹自己的遠(yuǎn)場語音技術(shù)多么厲害,現(xiàn)在很少有人提手機上語音識別的效果。
遠(yuǎn)場語音技術(shù)的三大關(guān)鍵點:第一、信號處理,沒有信號處理,就沒有現(xiàn)在的遠(yuǎn)場語音的效果,信號處理用于定位,定位算法才能創(chuàng)造遠(yuǎn)場語音智能;第二、軟硬結(jié)合,在遠(yuǎn)場交互時代,需要與硬度深度結(jié)合,將算法、軟件在硬件上打磨好,提升用戶體驗;第三、端到端語音語言一體化,信號處理基于端到端建模,聲學(xué)模型是匹配好場景的,還有喚醒技術(shù),采用端到端思路,對端到端詞匯進行建模,再將喚醒技術(shù)和信號處理技術(shù)結(jié)合,下沉到Duer OS系統(tǒng)層,才能達到很好的喚醒效果。
語音技術(shù)軟硬一體化解決方案
教會機器聽懂人話的過程,就是通過深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練聲學(xué)模型和語言模型的過程。而一些公司宣傳的機器識別準(zhǔn)確率過高,速記員都達不到這一水平,還有很多相關(guān)的工作需要去完成,不能單靠深度神經(jīng)網(wǎng)絡(luò)的方法來實現(xiàn)。語音識別準(zhǔn)確率涉及多方面原因,例如遠(yuǎn)場精確識別就是業(yè)界難題。
“最新一年百度在語音技術(shù)上兩大進展:一次喚醒多次交互技術(shù),技術(shù)特點是信號尾點和語義尾點聯(lián)合優(yōu)化模型;第二點,針對聲學(xué)模型和語義模型做雙重的置信度模型,在喚醒一次后可以和機器進行自由交談,技術(shù)的關(guān)鍵點是將干擾信息去除。需要端到端的思路,用信號衰減的思路,配合聲紋技術(shù),進行交互。這個技術(shù)會在小度系列的硬件產(chǎn)品落地。” 百度語音部門負(fù)責(zé)人解釋說。
百度在遠(yuǎn)場語音交互技術(shù)突破,包括一次喚醒多次交互技術(shù)以及 SMLTA 模型,SMLTA 模型在百度輸入法正式發(fā)布這個技術(shù),特點是語言和語義進行建模訓(xùn)練,這個模型可以跑在手機端,取得和在線識別媲美的效果。
百度歷經(jīng)一年多的打磨和開發(fā),全新推出了百度遠(yuǎn)場語音開發(fā)套件,包括遠(yuǎn)場語音端到端技術(shù)、兩款分別主打高性能和高性價比的計算板卡、3種形態(tài)的麥克風(fēng)陣列,形成了環(huán)形6+1麥、線形4麥和車載3麥的多形態(tài)麥克風(fēng)陣列套件方案。
“讓硬件制造商、ODM、OEM做智能音箱、智能電視、語音機器人、可穿戴設(shè)備和車載可以在百度大腦上找到和使用語音開發(fā)套件。我們希望提供一條產(chǎn)業(yè)鏈,讓上下游合作起來。” 百度語音部門負(fù)責(zé)人強調(diào)說。“這套開發(fā)套件的優(yōu)勢,靈活、快速讓開發(fā)者對接自己在場景中的資源,對接語義理解能力,對接知識庫。“
百度遠(yuǎn)場語音開發(fā)套件基于端到端方案,嚴(yán)格按照最佳技術(shù)實踐指導(dǎo)生產(chǎn),可解決語音交互產(chǎn)品研發(fā)過程中無可用設(shè)備選型、選型調(diào)試成本大、調(diào)試效果不佳等問題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識別和喚醒效果優(yōu)于同類產(chǎn)品,目前已落地150多款產(chǎn)品。
車載三麥克陣列,車上語音識別要求比較高,不僅是主音區(qū),而且是雙音區(qū)的語音識別,除了主駕駛位,還包括副駕駛位,百度車載三麥克鈍角陣列放置在車頂,可以輕松實現(xiàn)主音區(qū)和雙音區(qū)的語音識別,解決方案已經(jīng)在百度車聯(lián)網(wǎng)聯(lián)盟內(nèi)的被多個車廠采用。百度還在做DSP相關(guān)技術(shù),配合麥克風(fēng)陣列,價格更有競爭力。
主流芯片價格透明,兩年原廠開發(fā)經(jīng)驗,主板方案非常有競爭力。合作模式:語音端到端產(chǎn)品,開發(fā)時間長,需要重新開模和設(shè)計,直接貼牌,提供產(chǎn)品原型,在這個基礎(chǔ)上做二次開發(fā);線下做開發(fā),把方案放入適用的產(chǎn)品內(nèi)部。
百度大腦AI硬件生態(tài)聯(lián)盟
發(fā)布會現(xiàn)場,百度聯(lián)合首批合作伙伴成立百度大腦硬件生態(tài)聯(lián)盟,首批聯(lián)盟伙伴包含芯片廠商賽靈思,攝像頭模組廠商奧比中光、睿識、慧谷航天,開發(fā)套件廠商天啟,終端設(shè)備廠商華正聯(lián)等等。作為聯(lián)盟發(fā)起人和組織者,百度大腦希望與聯(lián)盟伙伴一起,共同制訂端計算與AI硬件標(biāo)準(zhǔn),共同促進和繁榮AI落地應(yīng)用。
百度大腦也將對聯(lián)盟合作伙伴提供深度技術(shù)支持、渠道支持、品牌授權(quán)、產(chǎn)品折扣和運營資源等權(quán)益,全面開啟AI技術(shù)終端化的大門,賦能合作伙伴的同時為產(chǎn)業(yè)帶來加速的交流和融合。正如百度AI技術(shù)生態(tài)部總經(jīng)理喻友平所言,人工智能若要長期推動各個產(chǎn)業(yè)的升級與優(yōu)化,需要合作伙伴的共同努力,打造適合AI發(fā)展的健康環(huán)境。
-
百度
+關(guān)注
關(guān)注
9文章
2332瀏覽量
92121 -
語音識別
+關(guān)注
關(guān)注
39文章
1779瀏覽量
114145 -
智能音箱
+關(guān)注
關(guān)注
31文章
1787瀏覽量
79729
發(fā)布評論請先 登錄
明遠(yuǎn)智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量
明遠(yuǎn)智睿SSD2351開發(fā)板:智能家居的智能核心
WT3000A在線AI語音芯片方案在智能藍牙音箱中的應(yīng)用
OptiFDTD應(yīng)用:二進制光柵建模及近場和遠(yuǎn)場模擬
2025中國(華東)智能家居技術(shù)創(chuàng)新研討會

OptiFDTD案例:二進制光柵建模及近場和遠(yuǎn)場模擬
「2024中國AIEV產(chǎn)業(yè)智駕創(chuàng)新企業(yè)」揭榜,文遠(yuǎn)知行光榮上榜

離線語音識別技術(shù)引領(lǐng)智能語音燈具市場——NRK3502

AI芯片驅(qū)動臺積電Q3財報亮眼!3nm和5nm營收飆漲,毛利率高達57.8%

魯大師2024年手機Q3季報:頂級旗艦激烈角逐,驍龍、天璣新芯片發(fā)布前最后一戰(zhàn)

遠(yuǎn)場應(yīng)用中的模擬麥克風(fēng)和ADC系統(tǒng)

使用bq40z50-R2過程中,Q4可以防止在適配器反接的時候,損壞Q3?
樂鑫聲學(xué)前端算法:打造智能語音交互新體驗,ESP32-S3 SOC技術(shù)方案

評論