21世紀(jì),人工智能為人類開啟了一個新時代。人工智能產(chǎn)業(yè)已經(jīng)上升至國家支持產(chǎn)業(yè),人工智能技術(shù)的發(fā)展對國家經(jīng)濟發(fā)展、產(chǎn)業(yè)轉(zhuǎn)型和技術(shù)進步起著至關(guān)重要的作用。近日,在2021全球人工智能技術(shù)大會(GAITC 2021)上,騰訊優(yōu)圖聯(lián)合廈門大學(xué)人工智能研究院共同發(fā)布了《2021十大人工智能趨勢》,基于長期對人工智能尤其是計算機視覺的研究洞察,提出3D視覺技術(shù)、數(shù)字內(nèi)容產(chǎn)業(yè)、AI多模態(tài)融合等方向的前沿預(yù)測。
趨勢報告顯示,3D視覺算法效果大幅提升雙重促進視覺體驗增強和生產(chǎn)成本下降,不斷推動商業(yè)發(fā)展和個人消費升級;AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,也將有希望為行業(yè)釋放更大的科技勢能,構(gòu)筑數(shù)字內(nèi)容生成新范式。
01
3D視覺技術(shù)助力產(chǎn)業(yè)消費升級,淡化 虛實邊界
作為視覺AI領(lǐng)域多年熱點研究方向之一,3D視覺技術(shù)的核心任務(wù)是對三維空間、物體及環(huán)境進行真實還原與重建。隨著相關(guān)算法與硬件計算能力的不斷升級, 3D視覺算法效果得到大幅提升,三維幾何重建更加精細(xì),表面紋理重建更加清晰,帶來更加逼真的視覺觀感。
近年來,諸多3D視覺研究成果為低成本高質(zhì)量的3D內(nèi)容生成提供了良好技術(shù)支撐,基于3D虛擬形象的舞臺演出、直播帶貨、教育互動等應(yīng)用層出不窮,成為AI內(nèi)容產(chǎn)業(yè)全新發(fā)展方向。以此為基礎(chǔ),結(jié)合5G時代流量帶寬的全面升級,帶有交互功能的3D虛擬現(xiàn)實、增強現(xiàn)實、混合現(xiàn)實的3D視覺應(yīng)用將用戶體驗向真實與虛擬的完美融合進一步邁進。
用戶會因為虛擬偶像生動自然的舞臺表演進行打賞,會由于虛擬主播“賣力”地帶貨促銷而下單購買,而線上平臺則依靠3D視覺技術(shù)大大降低內(nèi)容制作和IP運營成本,最終帶來社會商業(yè)發(fā)展模式與個人消費習(xí)慣的顛覆與變革。展望未來,3D視覺技術(shù)將持續(xù)在包括游戲娛樂、影視制作、電商直播、醫(yī)療整形等眾多領(lǐng)域廣泛應(yīng)用,虛擬與現(xiàn)實的邊界將不斷淡化。
02
人工智能推動數(shù)字內(nèi)容生成向新范式演進
隨著數(shù)字文化產(chǎn)業(yè)的蓬勃發(fā)展,尤其是二次元文化滲透出圈,數(shù)字內(nèi)容產(chǎn)業(yè)面臨新一輪的需求升級,伴隨著5G商業(yè)化進程的不斷加深,多元化、精品化的優(yōu)質(zhì)數(shù)字內(nèi)容將面臨更快的消費節(jié)奏,與此同時,供給側(cè)仍存在巨大的產(chǎn)能缺口,數(shù)字內(nèi)容產(chǎn)業(yè)正處于勞動密集型向科技密集型的轉(zhuǎn)型階段。
AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,將有希望為行業(yè)釋放更大的科技勢能,以GPT-3、DALL-E為代表的AI技術(shù),已在文本、語音、圖像、視頻等內(nèi)容生成中取得了令人驚艷的結(jié)果,然而在精確性、泛化性、合理性方面仍然面臨挑戰(zhàn),目前的前沿研究一方面探索從模型結(jié)構(gòu)(自動化搜索等),訓(xùn)練形式(無監(jiān)督對比學(xué)習(xí)等)等方面提升精度效果;另一方面引入知識圖譜領(lǐng)域知識,向機器介紹常識和其他特定領(lǐng)域的知識進而提升常識推理效果。
伴隨著技術(shù)的持續(xù)升級演進,我們預(yù)見AI將逐步在數(shù)字內(nèi)容生成領(lǐng)域釋放引擎級的影響力,在內(nèi)容、平臺、技術(shù)多方合力引導(dǎo)下,構(gòu)筑數(shù)字內(nèi)容生成新范式。
03
多模態(tài)融合加速AI認(rèn)知升維
深度學(xué)習(xí)在多個人工智能的細(xì)分領(lǐng)域(如視覺,自然語言處理等)已日趨成熟化和規(guī)模化,然而要真正實現(xiàn)通用人工智能,必然要將這些細(xì)分領(lǐng)域各自所針對的信息模態(tài)整合利用,即多模態(tài)融合。多模態(tài)融合的目標(biāo)是建立在圖像、文字、語音等的多模態(tài)信息識別的基礎(chǔ)上,實現(xiàn)不同模態(tài)信息的統(tǒng)一表征框架,從而起到1+1>2的作用。
典型的場景之一是通過圖文語音聯(lián)合識別,實現(xiàn)對隱晦和暗示性,招嫖廣告,兒童不良表情包等圖文混合內(nèi)容識別,支持審核業(yè)務(wù)深度打擊不良內(nèi)容。除了圖文融合等跨域模態(tài)融合,同域內(nèi)的不同信息維度同樣可以融合,如隨著深度生成技術(shù)的發(fā)展,當(dāng)前的人臉識別除了傳統(tǒng)的RGB圖外,還需要融合深度圖、紅外圖等信息來更好的防御越來越多元化的人臉偽造攻擊,實現(xiàn)更強的人臉防御。
隨著人工智能認(rèn)知能力的提升,多模態(tài)融合也將會從圖文等實質(zhì)性模態(tài),逐漸拓展到如物理關(guān)系,邏輯推斷,因果分析等知識性模態(tài),從感知智能邁向認(rèn)知智能。
04
無監(jiān)督/弱監(jiān)督學(xué)習(xí)逐漸成為企業(yè)降本增效新利器
在過去的幾年中,深度學(xué)習(xí)所取得的巨大成功離不開大規(guī)模標(biāo)注的數(shù)據(jù)集。大規(guī)模標(biāo)注成為企業(yè)發(fā)展過程中抬高交付成本、制約效果提升的主要因素之一。在此背景下,無監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)通過不使用標(biāo)簽或減少對標(biāo)簽數(shù)量、質(zhì)量的要求來迅速降低深度模型對于數(shù)據(jù)的標(biāo)注需求,使得原本無法利用的數(shù)據(jù)如今都可以加入到模型的訓(xùn)練中去,進而由量變引發(fā)質(zhì)變。
可以預(yù)見的是,將有越來越多的人工智能企業(yè)會面臨從前期的迅速擴張到穩(wěn)定期高效化運作的新階段,而在這個過程中,無監(jiān)督/弱監(jiān)督學(xué)習(xí)無疑將成為他們過渡到這個階段的重要手段之一。
除此之外,自動機器學(xué)習(xí)的自動化程度與可解釋性提升、邊緣計算與人工智能加速融合、人工智能內(nèi)核芯片向類腦神經(jīng)計算方向演進、AI算法公平性與隱私保護、人工智能技術(shù)向安全智能方向邁進等趨勢,也成為趨勢報告的關(guān)注重點。
文章出處:【微信公眾號:新機器視覺】
責(zé)任編輯:gt
-
計算機
+關(guān)注
關(guān)注
19文章
7651瀏覽量
90603 -
AI
+關(guān)注
關(guān)注
88文章
34918瀏覽量
278139 -
人工智能
+關(guān)注
關(guān)注
1806文章
48960瀏覽量
248590
原文標(biāo)題:2021十大人工智能趨勢:3D視覺技術(shù)如何助力產(chǎn)業(yè)消費升級
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

NVIDIA助力影眸科技3D生成工具Rodin升級
從3D到AI,機器視覺全面賦能工業(yè)自動化
英倫科技在光場裸眼3D顯示技術(shù)領(lǐng)域取得的成就和未來發(fā)展方向

3D打印技術(shù):如何讓古老文物重獲新生?
紅外熱成像技術(shù)在個人視覺領(lǐng)域的創(chuàng)新應(yīng)用

3D打印技術(shù),推動手板打樣從概念到成品的高效轉(zhuǎn)化
UV光固化技術(shù)在3D打印中的應(yīng)用

探索3D視覺技術(shù)在活塞桿自動化抓取中的應(yīng)用
適用于3D機器視覺的高度可擴展的TI DLP技術(shù)

3D視覺技術(shù)廣闊的應(yīng)用前景

居然還有這樣的10.1寸光場裸眼3D視覺訓(xùn)練平板電腦?

評論