電子發(fā)燒友網(wǎng)報道(文/黃山明)就在近期,華語樂壇的不少歌迷喜氣洋洋,認為目前的歌壇回到了20年前,歌迷們又享受到了許多動聽的歌聲。不過與以往不同的是,這些演唱者并非真人,而是一個個訓練出來的AI。
這些AI足以以假亂真,通過技術將一首音樂以更換演唱者的方式來進行不同的演繹,不僅為歌壇帶來了不一樣的視聽體驗,同時也引發(fā)了行業(yè)對AI技術應用的思考。在AI時代,我們的所見所聞,或許都是由AI創(chuàng)造的。
光怪陸離的AI時代
如今的網(wǎng)絡上有一個梗,要問今年哪個歌手最火,答案可能會出乎許多人意料,并不是某位歌手,而是一些由AI所制作出來的語音,如AI孫燕姿、AI周杰倫等。通過將原來歌手的聲音進行采集訓練,從而替換另一首歌的原唱。
通過這種方式,實現(xiàn)了讓自己喜歡的歌手唱另一首自己喜歡但非歌手的歌,比如用孫燕姿的聲音演唱周杰倫的《晴天》。關鍵在于,不論是演唱語調(diào)、技巧乃至音色,幾乎都與孫燕姿相差無幾。
實現(xiàn)這一技術目前已經(jīng)有一套標準流程,先通過收集大量的音樂和歌詞,并對這些數(shù)據(jù)進行清洗和標注,以便訓練算法和模型。再選擇合適的算法和模型,并進行優(yōu)化和調(diào)整,以提高虛擬人物的歌唱和表演能力。
通過語音合成技術將文字轉換為聲音,并對聲音進行處理和優(yōu)化,以達到更加自然和流暢的效果。最后將原來歌曲的聲音替換成語音合成的聲音,再進行調(diào)試,就能得到一首全新演唱的歌曲。
既然都已經(jīng)可以替換聲音演唱歌曲了,那么更進一步替換視頻畫面進行演繹也就不太難了。近期谷歌的I/O大會上,便公布了一項Universal Translator技術,該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調(diào)和氛圍。
這意味著該技術不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和面部表情,人物說話視頻會根據(jù)目標語言的發(fā)音同步改變口型。
當然,為了避免這項技術被用來制作虛假視頻,谷歌將這項技術只授權給少部分的合作廠商使用,普通人是無法接觸到的。但市場上如今已經(jīng)有許多類似的AI出現(xiàn),谷歌的此舉不過是略作限制,但無法阻止這股趨勢。
更有甚者,如一位美國網(wǎng)紅發(fā)布了AI版本的自己“Caryn AI”,這個應用是一款聊天機器人,可以作為用戶的虛擬伴侶,目前正在內(nèi)部測試階段,每分鐘收費一美元。
據(jù)美國雜志《財富》披露,就在過去一周的時間內(nèi),這款軟件已經(jīng)為其創(chuàng)造了7.16萬美元(約合人民幣50萬元)的收入,已經(jīng)吸引了超過1000名付費粉絲。
這種模式或許也將沖擊未來的娛樂行業(yè),想象每一位追星的粉絲,只要付費,都將擁有與自己偶像一對一聊天的機會,其所創(chuàng)造的價值潛力將是巨大的。
但這種由AI所創(chuàng)造出來的音樂、視頻、伴侶或者偶像,真的可以提供人們所需要的情緒價值嗎?這是個值得思考的問題。
AI之后的隱憂
盡管這些AI應用的落地前景非常誘人,比如采用AI替換歌曲中的聲音,就能夠實現(xiàn)歌手只需要提供聲音的模板,便可以進行批量的音樂制作。甚至不用自己演唱,也能夠推行相關專輯。
技術上主要通過機器學習技術,訓練機器模仿一個特定的歌手的音樂風格、聲音和唱腔,然后將這些技能應用于其他歌曲的錄制中。這種技術在一定程度上提高了錄制歌曲的效率和質(zhì)量,并且可以節(jié)省制作成本。
但如果使用他人的聲音進行創(chuàng)作,就可能有侵權的風險。尤其在數(shù)據(jù)采集階段,以語音替換為例,首先需要收集大量的語音數(shù)據(jù),并對這些數(shù)據(jù)進行標注和處理。標注可以包括音素、語調(diào)、語速等信息,以便訓練模型能夠準確地識別和替換語音。
這一過程便可能涉及到對用戶隱私數(shù)據(jù)的采用,甚至對用戶的隱私和數(shù)據(jù)安全造成威脅,還有可能進一步造成財產(chǎn)安全。因為語音合成就可能被犯罪分子用于詐騙,通過合成親屬或者熟人的聲音來謀取資金。
如果用AI更改視頻畫面甚至進一步篡改其中的對話,則可能造成更多的風險。比如將會遇到即便是用視頻聊天,也無法確定對面的是不是真的想要聯(lián)系的那個人。這項技術目前甚至已經(jīng)應用在許多的直播平臺中,比如一些虛擬主播、虛擬偶像等,如果一旦濫用,可能會造成更多的危害。
為了避免這一情況的發(fā)生,除了加強對AI技術的監(jiān)管,建立相應的法律制度和規(guī)范,還可以通過一些技術手段來避免自身的數(shù)據(jù)被采集,從而造成侵權以及侵犯隱私的風險。比如采用區(qū)塊鏈技術來保護數(shù)據(jù)的安全性和隱私性,采用人工智能算法來檢測和識別惡意行為等手段。
以區(qū)塊鏈技術為例,其去中心化和不可變性特點能夠確保數(shù)據(jù)的安全和完整性,因此可以用于AI技術的安全驗證和認證。基于區(qū)塊鏈技術,數(shù)據(jù)交互和交流的過程被保護,因此可以授權AI對數(shù)據(jù)的操作并確保AI數(shù)據(jù)訪問權限受到限制。
同時,區(qū)塊鏈技術還可以幫助人們更好地控制AI技術的使用,并提高AI的公正和透明性。例如,以基于區(qū)塊鏈技術的智能合約的方式來控制AI的使用,可以加強對AI系統(tǒng)的監(jiān)督,并確保其行為符合人類的期望和價值。
當然,區(qū)塊鏈技術還面臨著可擴展性、隱私保護等問題,同時在操作成本和技術難度方面也存在一定的限制,還無法完全避免AI濫用的問題。
我們還可以運用數(shù)字簽名技術檢測音頻和視頻是否被AI修改,數(shù)字簽名是指在文件中包含數(shù)字代碼的技術,在將文件傳輸或轉發(fā)給其他人時,可以驗證文件的完整性和真實性。或者使用機器學習算法來檢測這些變化,例如,可以使用深度神經(jīng)網(wǎng)絡來對音頻或視頻進行分析,以檢測其中的模式和結構是否與人類創(chuàng)作者的作品相似。如果發(fā)現(xiàn)有明顯的差異,則可能表明該作品是由AI生成的。
但隨著未來AI技術的發(fā)展,這些差異化和容易被檢測出來的問題都有可能被AI克服,使得我們最終很難分辨哪些產(chǎn)品是由AI制作,哪些才是由人所原創(chuàng)的。
寫在最后
隨著生成式AI技術的大爆發(fā),如ChatGPT、文心一言、訊飛星火等聊天機器人的出現(xiàn),讓人們工作效率得以極大地提高,Stable Diffusion、Midjourney等AI的出現(xiàn),讓圖片制作成本大幅降低,Universal Translator、Video Dubbing AI等,讓視頻也開始變得容易制作。
這些AI技術的出現(xiàn)顯然極大的解放了人們的生產(chǎn)力,讓人類發(fā)展走上快車道。當然有人會說以上這些AI都是通過收集大量數(shù)據(jù)之后,輸出縫合之后的產(chǎn)品,根本不能稱得上是原創(chuàng)。
但就像我們的學習過程一樣,最開始都是模仿,后來才開始擁有自己的獨立風格,但這些風格或多或少都會有之前學習過的影子,而這就是創(chuàng)造的過程,AI也是如此。
更值得關注的是,隨著AI技術的快速發(fā)展,其所帶來的風險也在與日俱增。如何更好的處理AI所引發(fā)的風險,將是我們未來所面對的主要問題。
這些AI足以以假亂真,通過技術將一首音樂以更換演唱者的方式來進行不同的演繹,不僅為歌壇帶來了不一樣的視聽體驗,同時也引發(fā)了行業(yè)對AI技術應用的思考。在AI時代,我們的所見所聞,或許都是由AI創(chuàng)造的。
光怪陸離的AI時代
如今的網(wǎng)絡上有一個梗,要問今年哪個歌手最火,答案可能會出乎許多人意料,并不是某位歌手,而是一些由AI所制作出來的語音,如AI孫燕姿、AI周杰倫等。通過將原來歌手的聲音進行采集訓練,從而替換另一首歌的原唱。
通過這種方式,實現(xiàn)了讓自己喜歡的歌手唱另一首自己喜歡但非歌手的歌,比如用孫燕姿的聲音演唱周杰倫的《晴天》。關鍵在于,不論是演唱語調(diào)、技巧乃至音色,幾乎都與孫燕姿相差無幾。
實現(xiàn)這一技術目前已經(jīng)有一套標準流程,先通過收集大量的音樂和歌詞,并對這些數(shù)據(jù)進行清洗和標注,以便訓練算法和模型。再選擇合適的算法和模型,并進行優(yōu)化和調(diào)整,以提高虛擬人物的歌唱和表演能力。
通過語音合成技術將文字轉換為聲音,并對聲音進行處理和優(yōu)化,以達到更加自然和流暢的效果。最后將原來歌曲的聲音替換成語音合成的聲音,再進行調(diào)試,就能得到一首全新演唱的歌曲。
既然都已經(jīng)可以替換聲音演唱歌曲了,那么更進一步替換視頻畫面進行演繹也就不太難了。近期谷歌的I/O大會上,便公布了一項Universal Translator技術,該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調(diào)和氛圍。
這意味著該技術不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和面部表情,人物說話視頻會根據(jù)目標語言的發(fā)音同步改變口型。
當然,為了避免這項技術被用來制作虛假視頻,谷歌將這項技術只授權給少部分的合作廠商使用,普通人是無法接觸到的。但市場上如今已經(jīng)有許多類似的AI出現(xiàn),谷歌的此舉不過是略作限制,但無法阻止這股趨勢。
更有甚者,如一位美國網(wǎng)紅發(fā)布了AI版本的自己“Caryn AI”,這個應用是一款聊天機器人,可以作為用戶的虛擬伴侶,目前正在內(nèi)部測試階段,每分鐘收費一美元。
據(jù)美國雜志《財富》披露,就在過去一周的時間內(nèi),這款軟件已經(jīng)為其創(chuàng)造了7.16萬美元(約合人民幣50萬元)的收入,已經(jīng)吸引了超過1000名付費粉絲。
這種模式或許也將沖擊未來的娛樂行業(yè),想象每一位追星的粉絲,只要付費,都將擁有與自己偶像一對一聊天的機會,其所創(chuàng)造的價值潛力將是巨大的。
但這種由AI所創(chuàng)造出來的音樂、視頻、伴侶或者偶像,真的可以提供人們所需要的情緒價值嗎?這是個值得思考的問題。
AI之后的隱憂
盡管這些AI應用的落地前景非常誘人,比如采用AI替換歌曲中的聲音,就能夠實現(xiàn)歌手只需要提供聲音的模板,便可以進行批量的音樂制作。甚至不用自己演唱,也能夠推行相關專輯。
技術上主要通過機器學習技術,訓練機器模仿一個特定的歌手的音樂風格、聲音和唱腔,然后將這些技能應用于其他歌曲的錄制中。這種技術在一定程度上提高了錄制歌曲的效率和質(zhì)量,并且可以節(jié)省制作成本。
但如果使用他人的聲音進行創(chuàng)作,就可能有侵權的風險。尤其在數(shù)據(jù)采集階段,以語音替換為例,首先需要收集大量的語音數(shù)據(jù),并對這些數(shù)據(jù)進行標注和處理。標注可以包括音素、語調(diào)、語速等信息,以便訓練模型能夠準確地識別和替換語音。
這一過程便可能涉及到對用戶隱私數(shù)據(jù)的采用,甚至對用戶的隱私和數(shù)據(jù)安全造成威脅,還有可能進一步造成財產(chǎn)安全。因為語音合成就可能被犯罪分子用于詐騙,通過合成親屬或者熟人的聲音來謀取資金。
如果用AI更改視頻畫面甚至進一步篡改其中的對話,則可能造成更多的風險。比如將會遇到即便是用視頻聊天,也無法確定對面的是不是真的想要聯(lián)系的那個人。這項技術目前甚至已經(jīng)應用在許多的直播平臺中,比如一些虛擬主播、虛擬偶像等,如果一旦濫用,可能會造成更多的危害。
為了避免這一情況的發(fā)生,除了加強對AI技術的監(jiān)管,建立相應的法律制度和規(guī)范,還可以通過一些技術手段來避免自身的數(shù)據(jù)被采集,從而造成侵權以及侵犯隱私的風險。比如采用區(qū)塊鏈技術來保護數(shù)據(jù)的安全性和隱私性,采用人工智能算法來檢測和識別惡意行為等手段。
以區(qū)塊鏈技術為例,其去中心化和不可變性特點能夠確保數(shù)據(jù)的安全和完整性,因此可以用于AI技術的安全驗證和認證。基于區(qū)塊鏈技術,數(shù)據(jù)交互和交流的過程被保護,因此可以授權AI對數(shù)據(jù)的操作并確保AI數(shù)據(jù)訪問權限受到限制。
同時,區(qū)塊鏈技術還可以幫助人們更好地控制AI技術的使用,并提高AI的公正和透明性。例如,以基于區(qū)塊鏈技術的智能合約的方式來控制AI的使用,可以加強對AI系統(tǒng)的監(jiān)督,并確保其行為符合人類的期望和價值。
當然,區(qū)塊鏈技術還面臨著可擴展性、隱私保護等問題,同時在操作成本和技術難度方面也存在一定的限制,還無法完全避免AI濫用的問題。
我們還可以運用數(shù)字簽名技術檢測音頻和視頻是否被AI修改,數(shù)字簽名是指在文件中包含數(shù)字代碼的技術,在將文件傳輸或轉發(fā)給其他人時,可以驗證文件的完整性和真實性。或者使用機器學習算法來檢測這些變化,例如,可以使用深度神經(jīng)網(wǎng)絡來對音頻或視頻進行分析,以檢測其中的模式和結構是否與人類創(chuàng)作者的作品相似。如果發(fā)現(xiàn)有明顯的差異,則可能表明該作品是由AI生成的。
但隨著未來AI技術的發(fā)展,這些差異化和容易被檢測出來的問題都有可能被AI克服,使得我們最終很難分辨哪些產(chǎn)品是由AI制作,哪些才是由人所原創(chuàng)的。
寫在最后
隨著生成式AI技術的大爆發(fā),如ChatGPT、文心一言、訊飛星火等聊天機器人的出現(xiàn),讓人們工作效率得以極大地提高,Stable Diffusion、Midjourney等AI的出現(xiàn),讓圖片制作成本大幅降低,Universal Translator、Video Dubbing AI等,讓視頻也開始變得容易制作。
這些AI技術的出現(xiàn)顯然極大的解放了人們的生產(chǎn)力,讓人類發(fā)展走上快車道。當然有人會說以上這些AI都是通過收集大量數(shù)據(jù)之后,輸出縫合之后的產(chǎn)品,根本不能稱得上是原創(chuàng)。
但就像我們的學習過程一樣,最開始都是模仿,后來才開始擁有自己的獨立風格,但這些風格或多或少都會有之前學習過的影子,而這就是創(chuàng)造的過程,AI也是如此。
更值得關注的是,隨著AI技術的快速發(fā)展,其所帶來的風險也在與日俱增。如何更好的處理AI所引發(fā)的風險,將是我們未來所面對的主要問題。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
谷歌
+關注
關注
27文章
6231瀏覽量
107982 -
AI
+關注
關注
88文章
34936瀏覽量
278276 -
AIGC
+關注
關注
1文章
386瀏覽量
2408
發(fā)布評論請先 登錄
相關推薦
熱點推薦
谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命
谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設計。這款功能強大的

Halliday AI眼鏡爆火,炬芯科技端側AI芯片助力非凡體驗
超過300萬美金。這一壯舉不僅體現(xiàn)了市場對AI智能設備的強烈需求,也標志著AR/AI眼鏡行業(yè)邁入了一個全新的時代。 在2025年的CES展會
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡
,成為新一代AI數(shù)據(jù)中心的核心驅動力。
AI時代的兩大數(shù)據(jù)中心:AI工廠與AI云
發(fā)表于 03-25 17:35
企業(yè)AI產(chǎn)品升級解決方案如何選?看這一篇就夠了!
AI硬件產(chǎn)品的爆火讓市面上出現(xiàn)了一大批AI硬件產(chǎn)品,市面上的AI產(chǎn)品解決方案也是琳瑯滿目,那企業(yè)

AI玩具爆火,芯片方案涌入
。 ? 由于大模型在端側落地趨勢到來,字節(jié)的豆包大模型、 DeepSeek大模型等接入玩具,使得AI玩具這一品類迅速興起,市場潛力非常大。 ? 根據(jù)咨詢公司IMARC集團報告,AI玩具市場有望在未來幾年實現(xiàn)爆發(fā)式的增長,數(shù)據(jù)顯示
芯盾時代助力政企客戶打造AI大模型安全防線
隨著DeepSeek爆火,政府、企業(yè)掀起了本地化部署AI大模型的浪潮。有了自己的AI大模型,不但能提升業(yè)務效率,為客戶提供更好的服務,還能探索AI
又一個中國AI產(chǎn)品Manus刷屏 中國AI新星Manus爆火 全網(wǎng)搶邀請碼
Manus 的 AI 產(chǎn)品在科技圈一夜爆火,全球首款通用智能體Manus開啟內(nèi)測爆火,據(jù)說現(xiàn)在很
AI先鋒對話:DeepSeek爆火背后,戰(zhàn)略破局的新思考
近日,阿丘科技聯(lián)合創(chuàng)始人鄭慧偉受邀參加由慎思行舉辦的《戰(zhàn)略簡史》老友會,與慎思行老羅、云南白藥戰(zhàn)略負責人顧嘉,一起探討AI將如何影響未來戰(zhàn)略這一時代命題。本次討論主要圍繞“DeepSeek火爆背后

燧原科技助力美圖AI換裝全球爆火
2025蛇年元宵后,美圖公司旗下美顏相機憑借“AI換裝”功能爆火,獲得了國內(nèi)外用戶的極大青睞,App下載量和使用量迅速激增的同時,也面臨了海量推理算力即時支持的挑戰(zhàn)。
當我問DeepSeek AI爆發(fā)時代的FPGA是否重要?答案是......
在AI時代,F(xiàn)PGA(現(xiàn)場可編程門陣列)具有極其重要的地位,主要體現(xiàn)在以下幾個方面:
1.硬件加速與高效能
? 并行處理能力:FPGA內(nèi)部由大量可編程邏輯單元組成,能夠實現(xiàn)高度并行的數(shù)據(jù)處理。這種
發(fā)表于 02-19 13:55
AI賦能邊緣網(wǎng)關:開啟智能時代的新藍海
。這一變革不僅帶來了技術架構的革新,更為產(chǎn)業(yè)發(fā)展開辟了新的增長空間。
傳統(tǒng)邊緣網(wǎng)關受限于計算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡單處理,大量原始數(shù)據(jù)需要回傳云端處理,導致響應延遲和帶寬壓力。AI技術
發(fā)表于 02-15 11:41
2025 CES落幕,AI定義汽車時代正式啟航
2025年的國際消費電子展(CES)雖已落幕多日,但其帶來的變革余波仍在持續(xù)蕩漾。一個顯著的趨勢是,汽車行業(yè)正經(jīng)歷從“軟件定義汽車”向“AI定義汽車”的深刻轉變,這一轉變標志著汽車智能化進入了全新的2.0
特斯拉加大AI投資,緯創(chuàng)成AI服務器市場贏家
近日,特斯拉宣布將全力沖刺AI投資,主要用于訓練自動駕駛系統(tǒng)。為實現(xiàn)這一目標,特斯拉計劃在得州超級工廠大幅增加AI服務器的數(shù)量,從目前的2.9萬組提升至5萬組,增幅超過七成。
評論