AI可能很快就會成為盟友,以消除語音助手的喚醒詞??▋?nèi)基梅隆大學(xué)的研究人員開發(fā)了一種機器學(xué)習(xí)模型,該模型可以估計語音的發(fā)出方向,無需特殊的短語或手勢即可表明您的意圖。該方法依賴于聲音在房間周圍反彈時的固有特性。
系統(tǒng)認識到,第一個,最響亮和最清晰的聲音始終是直接針對給定對象的聲音。其他任何事情都傾向于安靜,延遲和悶悶不樂。該模型還知道,人類的語音頻率會根據(jù)您所面對的方向而變化。較低的頻率傾向于全向。
研究人員補充說,這種方法基于軟件“輕巧”,不需要將音頻數(shù)據(jù)發(fā)送到云。
盡管團隊已經(jīng)公開發(fā)布了代碼和數(shù)據(jù)來幫助其他人繼續(xù)工作,但是您可能還需要一段時間才能看到使用的技術(shù)。至少很容易看出這可能導(dǎo)致什么。您可以告訴智能揚聲器播放音樂,而無需使用喚醒詞或引起大量其他連接設(shè)備的騷擾。它可能需要您的身體狀態(tài),而無需使用注視檢測相機,從而有助于保護隱私。換句話說,它將更接近“星際迷航”中語音助手的愿景,后者始終會在您與他們交談時知道。
責任編輯:lq
-
代碼
+關(guān)注
關(guān)注
30文章
4895瀏覽量
70548 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8500瀏覽量
134431 -
語音助手
+關(guān)注
關(guān)注
7文章
241瀏覽量
27134
發(fā)布評論請先 登錄
輪式移動機器人電機驅(qū)動系統(tǒng)的研究與開發(fā)
研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測瘧疾
NanoEdge AI Studio 面向STM32開發(fā)人員機器學(xué)習(xí)(ML)技術(shù)

機器學(xué)習(xí)模型市場前景如何
Qwen大模型助力開發(fā)低成本AI推理方案
【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型
【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗
研究人員利用激光束開創(chuàng)量子計算新局面

NaVILA:加州大學(xué)與英偉達聯(lián)合發(fā)布新型視覺語言模型
一種信息引導(dǎo)的量化后LLM微調(diào)新算法IR-QLoRA

AI大模型與深度學(xué)習(xí)的關(guān)系
名單公布!【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南
一種新型全光學(xué)智能光譜儀

評論