女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出端到端語音翻譯技術,讓優質高效的機器翻譯不再遙遙無期

電子工程師 ? 來源:YXQ ? 2019-05-17 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

40年前,英國科幻作家Douglas Adams在他的《銀河系漫游指南》中這樣描述巴別魚(bable fish):迷你黃色生物,水蛭狀,以聲音中的語言概念為食,消化后排出跟寄主同頻的腦波。只要塞到耳朵里去,就可以聽懂各種語言。

而在這個充滿嬉皮風格的科幻作品中,來自地球的Arthur Dent也因為這條丑陋的魚,能夠完美地理解并與他遇到的各種外星種族交流。

自小說誕生,巴別魚便成為了即時語音翻譯的代名詞。但在當時,人類的翻譯技術距離這一目標仍遙不可及。

直到2014年,加拿大蒙特利爾大學的Kyunghyun Cho、Yoshua Bengio等人發布了一篇在機器翻譯領域應用神經網絡的論文——Neural Machine Translation by Jointly Learning to Align and Translate。

神經網絡的出現,讓優質高效的機器翻譯不再遙遙無期。

每次技術的突破都讓我們離巴別魚更近一步,直到今天,谷歌的發布了一項新研究Translatotron,這是一種可以實現端到端的語音轉語音的翻譯技術。該工具放棄了將語音翻譯成文本在返回語音的步驟,可以直接從一種語言轉換稱另外一種語言,并同時保持說話著的語調和節奏。

告別Siri,我們先來感受一下翻譯的調調:

通過結合揚聲器編碼器網絡,使得Translatotron能夠在翻譯的語音中保留原始揚聲器的聲音特征,這使得翻譯的語音聽起來更自然,更少刺耳。

更多聲音樣本可以在Translatotron的Google Research的Github頁面上找到。

此功能利用了谷歌之前specker verification 和 speaker adaptation for TTS 的研究。揚聲器編碼器在specker verification任務上預先訓練,學習從簡短的示例話語對揚聲器特性進行編碼。即使內容是不同的語言,該編碼上調節頻譜圖解碼器也可使得合成具有類似揚聲器特性的語音。

Translatotron模型

其實語音翻譯的端到端模型的早在2016年就開始出現了,當時研究人員證明了使用單個序列到序列模型進行語音到文本翻譯的可行性。

2017年,谷歌研究員們證明了這種端到端模型可以勝過cascade模型。之后又進一步改進許多端到端語音到文本翻譯模型的方法。

最終在2019年,谷歌的研究員們在arXiv發表Translatotron模型,通過證明單個序列到序列模型可以直接將語言從一種語言翻譯成另一種語言的語音,而不依賴于任何一種語言的中間文本表示。

Translatotron基于序列到序列網絡將源光譜圖作為輸入并生成目標語言中的翻譯內容的光譜圖輸出。它還使用了另外兩個經過單獨訓練的組件:神經聲碼器將輸出頻譜圖轉換為時域波形,使用揚聲器編碼器來保持合成的翻譯語音中源說話者的語音的特征。

在訓練期間,序列到序列模型使用多任務目標來在生成目標譜圖的同時預測源和目標轉錄物。

Translatotron的模型結構

該團隊稱,翻譯的準確性并不如傳統翻譯系統那么好,傳統系統有更多時間來磨練其準確性。但Translatotron是第一個能夠將語言從一種語言直接翻譯成另一種語言的語音的端到端模型。他們希望這項工作可以作為未來端到端語音轉語音翻譯系統研究的起點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    107969
  • 語音識別
    +關注

    關注

    39

    文章

    1779

    瀏覽量

    114145

原文標題:巴別魚雛形,谷歌推出端到端語音翻譯技術,還能模仿你說話

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    時空壺 T1 離線翻譯機:解鎖無網生活溝通自由

    頻頻“掉鏈子”。時空壺T1離線翻譯機,憑借強大的側AI模型與離線翻譯能力,為人們在多元生活場景中打破語言壁壘,帶來高效、穩定且流暢的溝通體驗。一、全場景適配,出
    的頭像 發表于 06-05 10:30 ?282次閱讀
    時空壺 T1 離線<b class='flag-5'>翻譯</b>機:解鎖無網生活溝通自由

    AI助力實時翻譯耳機

    你是否曾經因為語言障礙而無法與外國人順暢交流?或者在旅行中因為語言不通而錯過了一些精彩的經歷?現在,隨著AI技術的發展,實時翻譯耳機可以幫你輕松解決這些問題。 1 什么是實時翻譯耳機 實時翻譯
    的頭像 發表于 01-24 11:14 ?1601次閱讀
    AI助力實時<b class='flag-5'>翻譯</b>耳機

    自動駕駛技術研究與分析

    編者語:「智駕最前沿」微信公眾號后臺回復:C-0450,獲取本文參考報告:《自動駕駛行業研究報告》pdf下載方式。 自動駕駛進入2024年,
    的頭像 發表于 12-19 13:07 ?869次閱讀

    階躍星辰發布國內首個千億參數語音大模型

    近日,階躍星辰在官方公眾號上宣布了一項重大突破——推出Step-1o千億參數語音大模型。該模型被譽為“國內首個千億參數
    的頭像 發表于 12-17 13:43 ?727次閱讀

    準確性超Moshi和GLM-4-Voice,語音雙工模型Freeze-Omni

    GPT-4o 提供的全雙工語音對話帶來了一股研究熱潮,目前諸多工作開始研究如何利用 LLM 來實現語音
    的頭像 發表于 12-17 10:21 ?894次閱讀
    準確性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>語音</b>雙工模型Freeze-Omni

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機語言
    的頭像 發表于 12-09 11:11 ?965次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    爆火的如何加速智駕落地?

    編者語:「智駕最前沿」微信公眾號后臺回復:C-0551,獲取本文參考報告:《智能汽車技術研究報告》pdf下載方式。 “
    的頭像 發表于 11-26 13:17 ?1111次閱讀
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智駕落地?

    Waymo利用谷歌Gemini大模型,研發端自動駕駛系統

    邁新步,為其機器人出租車業務引入了一種基于谷歌多模態大語言模型(MLLM)“Gemini”的全新訓練模型——“多模態自動駕駛模型”(E
    的頭像 發表于 10-31 16:55 ?1682次閱讀

    智己汽車“”智駕方案推出,老司機真的會被取代嗎?

    隨著智能駕駛技術的發展,行業已經從早期基于簡單規則和模塊化邏輯的自動駕駛,逐步邁向依托深度學習的高復雜度智能駕駛解決方案,各車企也緊跟潮流,先后宣布了自己的智駕方案。就在近期,智
    的頭像 發表于 10-30 09:47 ?807次閱讀
    智己汽車“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智駕方案<b class='flag-5'>推出</b>,老司機真的會被取代嗎?

    智駕強者愈強時代來臨?

    編者語: 「智駕最前沿」微信公眾號后臺回復: C-0572 ,獲取本文參考報告:《信達證券:革命開啟,強者愈強時時代即將來臨》pdf下載方式。 隨著科技進步和汽車技術的發展,智能
    的頭像 發表于 10-24 09:25 ?969次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>讓</b>智駕強者愈強時代來臨?

    InfiniBand網絡解決LLM訓練瓶頸

    ChatGPT對技術的影響引發了對人工智能未來的預測,尤其是多模態技術的關注。OpenAI推出了具有突破性的多模態模型GPT-4,使各個領域取得了顯著的發展。 這些AI進步是通過大規模模型訓練實現
    的頭像 發表于 10-23 11:26 ?1491次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand網絡解決LLM訓練瓶頸

    測試用例怎么寫

    編寫測試用例是確保軟件系統從頭到尾能夠正常工作的關鍵步驟。以下是一個詳細的指南,介紹如何編寫
    的頭像 發表于 09-20 10:29 ?941次閱讀

    實現自動駕駛,唯有?

    ,去年行業主流方案還是輕高精地圖城區智駕,今年大家的目標都瞄到了(End-to-End, E2E)。
    的頭像 發表于 08-12 09:14 ?1489次閱讀
    實現自動駕駛,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領域,DeepL再次以其創新實力引領潮流,宣布成功推出新一代面向翻譯與編輯應用的大型語言模型。這一里程碑式的進展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位,更標志著機器翻譯
    的頭像 發表于 07-19 15:56 ?997次閱讀

    循環神經網絡在語音識別中的應用

    (Recurrent Neural Networks, RNN)在語音識別領域的應用日益廣泛,特別是在語音識別系統中,RNN及其變體如
    的頭像 發表于 07-08 11:09 ?1129次閱讀
    主站蜘蛛池模板: 富宁县| 吉隆县| 珲春市| 安新县| 内丘县| 方城县| 三台县| 昌都县| 仪征市| 阆中市| 成安县| 承德县| 曲阜市| 祁连县| 文成县| 惠来县| 辽阳市| 洛阳市| 雅江县| 余干县| 新昌县| 全州县| 彝良县| 军事| 蛟河市| 扎囊县| 吐鲁番市| 虎林市| 青田县| 河北区| 永济市| 林甸县| 酒泉市| 武山县| 隆安县| 缙云县| 马公市| 泽库县| 丰顺县| 都安| 昌图县|