女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI文生視頻模型Sora要點(diǎn)分析

架構(gòu)師技術(shù)聯(lián)盟 ? 來(lái)源:芯智訊 ? 2024-02-22 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

? 近日,美國(guó)人工智能公司OpenAI發(fā)布了首個(gè)視頻生成模型Sora。不同于此前許多AI大模型文生圖或視頻時(shí),會(huì)出現(xiàn)人物形象前后不一致等問(wèn)題,此次OpenAI展示的Sora生成的視頻中的主角、背景人物,都展現(xiàn)了極強(qiáng)的一致性,可以支持60秒一鏡到底,并包含高細(xì)致背景、多角度鏡頭,以及富有情感的多個(gè)角色,可謂是相當(dāng)?shù)摹罢选薄I踔劣胁簧偃思埠簦瑐鹘y(tǒng)視頻制作行業(yè)將會(huì)被“革命”!

相關(guān)內(nèi)容參考“OpenAI視頻模型Sora替代品分析(2024)”、“一場(chǎng)AI“革命”開(kāi)始,OpenAI文生視頻模型Sora”。

據(jù)OpenAI官網(wǎng)介紹,Sora“通過(guò)一次性為模型提供多幀的預(yù)測(cè),我們解決了一個(gè)具有挑戰(zhàn)性的問(wèn)題”。據(jù)了解,此次大模型完美繼承DALL·E 3的畫(huà)質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。并且在隨后公布的多段AI生成的視頻中,無(wú)論鏡頭如何切換,人物前后都保持了高度的穩(wěn)定性。

總結(jié)來(lái)說(shuō),Sora大模型的強(qiáng)大之處主要有以下六點(diǎn):

1、文本到視頻生成能力:Sora能夠根據(jù)用戶提供的文本描述生成長(zhǎng)達(dá)60S的視頻,這些視頻不僅保持了視覺(jué)品質(zhì),而且完整準(zhǔn)確還原了用戶的提示語(yǔ)。

2、復(fù)雜場(chǎng)景和角色生成能力:Sora能夠生成包含多個(gè)角色、特定運(yùn)動(dòng)類型以及主題精確、背景細(xì)節(jié)復(fù)雜的場(chǎng)景。它能夠創(chuàng)造出生動(dòng)的角色表情和復(fù)雜的運(yùn)鏡,使得生成的視頻具有高度的逼真性和敘事效果。

3、語(yǔ)言理解能力:Sora擁有深入的語(yǔ)言理解能力,能夠準(zhǔn)確解釋提示并生成能表達(dá)豐富情感的角色。這使得模型能夠更好地理解用戶的文本指令,并在生成的視頻內(nèi)容中忠實(shí)地反映這些指令。

4、多鏡頭生成能力:Sora可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,同時(shí)保持角色和視覺(jué)風(fēng)格的一致性。這種能力對(duì)于制作電影預(yù)告片、動(dòng)畫(huà)或其他需要多視角展示的內(nèi)容非常有用。

5、從靜態(tài)圖像生成視頻能力:Sora不僅能夠從文本生成視頻,還能夠從現(xiàn)有的靜態(tài)圖像開(kāi)始,準(zhǔn)確地動(dòng)畫(huà)化圖像內(nèi)容,或者擴(kuò)展現(xiàn)有視頻,填補(bǔ)視頻中的缺失幀。

6、物理世界模擬能力:Sora展示了人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)的能力,這是朝著實(shí)現(xiàn)通用人工智能(AGI)的重要一步。它能夠模擬真實(shí)物理世界的運(yùn)動(dòng),如物體的移動(dòng)和相互作用。 可以說(shuō),Sora的出現(xiàn),預(yù)示著一個(gè)全新的視覺(jué)敘事時(shí)代的到來(lái),它能夠?qū)⑷藗兊南胂罅D(zhuǎn)化為生動(dòng)的動(dòng)態(tài)畫(huà)面,將文字的魔力轉(zhuǎn)化為視覺(jué)的盛宴。在這個(gè)由數(shù)據(jù)和算法編織的未來(lái),Sora正以其獨(dú)特的方式,或?qū)⒅匦露x我們與數(shù)字世界的互動(dòng)。

OpenAI在模型公布后的不久,就公布了相關(guān)的技術(shù)論文《Video generation models as world simulators》。以下為論文的主要內(nèi)容:

a492a0d4-d119-11ee-a297-92fbcf53809c.png

Sora的技術(shù)特點(diǎn)

三維空間的連貫性:Sora可以生成帶有動(dòng)態(tài)相機(jī)運(yùn)動(dòng)的視頻。隨著相機(jī)移動(dòng)和旋轉(zhuǎn),人物和場(chǎng)景元素在三維空間中保持連貫的運(yùn)動(dòng)。

模擬數(shù)字世界:Sora還能模擬人工過(guò)程,如視頻游戲。Sora能夠同時(shí)控制Minecraft中的玩家,并高保真地渲染游戲世界及其動(dòng)態(tài)。通過(guò)提及“Minecraft”的提示,可以零樣本地激發(fā)Sora的這些能力

長(zhǎng)期連續(xù)性和物體持久性:對(duì)視頻生成系統(tǒng)來(lái)說(shuō),Sora通常能夠有效地模擬短期和長(zhǎng)期的依賴關(guān)系。同樣,它能在一個(gè)樣本中生成同一角色的多個(gè)鏡頭,確保其在整個(gè)視頻中的外觀一致。

與世界互動(dòng):Sora有時(shí)能夠模擬對(duì)世界狀態(tài)產(chǎn)生簡(jiǎn)單影響的行為。例如,畫(huà)家可以在畫(huà)布上留下隨時(shí)間持續(xù)的新筆觸,或者一個(gè)人吃漢堡時(shí)留下咬痕。

訓(xùn)練過(guò)程

Sora 的訓(xùn)練受到了大語(yǔ)言模型(Large Language Model)的啟發(fā)。這些模型通過(guò)在互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)上進(jìn)行訓(xùn)練,從而獲得了廣泛的能力。

Sora實(shí)際上是一種擴(kuò)散型變換器模型(diffusion transformer)。首先將視頻壓縮到一個(gè)低維潛在空間中,然后將這種表現(xiàn)形式分解成時(shí)空區(qū)塊,從而將視頻轉(zhuǎn)換為區(qū)塊。它能夠接受帶有噪聲的patch(和條件信息,如文本提示)作為輸入,隨后被訓(xùn)練,來(lái)預(yù)測(cè)原始的“干凈”patch。

a497c9e2-d119-11ee-a297-92fbcf53809c.png

訓(xùn)練了一個(gè)用于降低視覺(jué)數(shù)據(jù)維度的網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)以原始視頻為輸入,輸出在時(shí)間和空間上都被壓縮的潛在表示。Sora在這個(gè)壓縮的潛在空間上進(jìn)行訓(xùn)練,并在此空間中生成視頻。還開(kāi)發(fā)了一個(gè)對(duì)應(yīng)的解碼器模型,它能將生成的潛在表示映射回到像素空間。

對(duì)于給定的壓縮輸入視頻,提取一系列時(shí)空區(qū)塊,它們?cè)谧儞Q器模型中充當(dāng)標(biāo)記(token)。這種方案同樣適用于圖像,因?yàn)閳D像本質(zhì)上是單幀的視頻。基于區(qū)塊的表示方法使Sora能夠針對(duì)不同分辨率、持續(xù)時(shí)間和縱橫比的視頻和圖像進(jìn)行訓(xùn)練。在推理過(guò)程中,可以通過(guò)在適當(dāng)大小的網(wǎng)格中排列隨機(jī)初始化的區(qū)塊來(lái)控制生成視頻的大小。

隨著 Sora 訓(xùn)練計(jì)算量的增加,樣本質(zhì)量有了顯著提升。

Sora訓(xùn)練時(shí)沒(méi)有對(duì)素材進(jìn)行裁切,使得Sora能夠直接為不同設(shè)備以其原生縱橫比創(chuàng)造內(nèi)容。針對(duì)視頻的原生縱橫比進(jìn)行訓(xùn)練,還可以提高構(gòu)圖和取景的質(zhì)量。

它還可以先以較低分辨率快速制作出視頻原型,再用相同的模型制作出全分辨率的視頻。

訓(xùn)練文本到視頻的生成系統(tǒng)需要大量配有相應(yīng)文本提示的視頻。應(yīng)用了在DALL·E 3中引入的重新字幕技術(shù)到視頻上。

與DALL·E 3相似,也利用了GPT技術(shù),將用戶的簡(jiǎn)短提示轉(zhuǎn)換成更詳細(xì)的提示,然后發(fā)送給視頻模型。

論文關(guān)鍵點(diǎn)

OpenAI 的研究論文《Video generation models as world simulators》探討了在視頻數(shù)據(jù)上進(jìn)行大規(guī)模訓(xùn)練生成模型的方法。這項(xiàng)研究特別關(guān)注于文本條件擴(kuò)散模型,這些模型同時(shí)在視頻和圖像上進(jìn)行訓(xùn)練,處理不同時(shí)長(zhǎng)、分辨率和寬高比的數(shù)據(jù)。研究中提到的最大模型 Sora 能夠生成長(zhǎng)達(dá)一分鐘的高保真視頻。以下是論文的一些關(guān)鍵點(diǎn):

統(tǒng)一的視覺(jué)數(shù)據(jù)表示:研究者們將所有類型的視覺(jué)數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的表示,以便進(jìn)行大規(guī)模的生成模型訓(xùn)練。Sora 使用視覺(jué)補(bǔ)丁(patches)作為其表示方式,類似于大型語(yǔ)言模型(LLM)中的文本標(biāo)記。

視頻壓縮網(wǎng)絡(luò):研究者們訓(xùn)練了一個(gè)網(wǎng)絡(luò),將原始視頻壓縮到一個(gè)低維潛在空間,并將其表示分解為時(shí)空補(bǔ)丁。Sora 在這個(gè)壓縮的潛在空間中進(jìn)行訓(xùn)練,并生成視頻。

擴(kuò)散模型:Sora 是一個(gè)擴(kuò)散模型,它通過(guò)預(yù)測(cè)原始“干凈”的補(bǔ)丁來(lái)從輸入的噪聲補(bǔ)丁中生成視頻。擴(kuò)散模型在語(yǔ)言建模、計(jì)算機(jī)視覺(jué)和圖像生成等領(lǐng)域已經(jīng)顯示出了顯著的擴(kuò)展性。

視頻生成的可擴(kuò)展性:Sora 能夠生成不同分辨率、時(shí)長(zhǎng)和寬高比的視頻,包括全高清視頻。這種靈活性使得 Sora 能夠直接為不同設(shè)備生成內(nèi)容,或者在生成全分辨率視頻之前快速原型化內(nèi)容。

語(yǔ)言理解:為了訓(xùn)練文本到視頻生成系統(tǒng),需要大量的視頻和相應(yīng)的文本標(biāo)題。研究者們應(yīng)用了在 DALL·E 3 中引入的重新描述技術(shù),首先訓(xùn)練一個(gè)高度描述性的標(biāo)題生成器,然后為訓(xùn)練集中的所有視頻生成文本標(biāo)題。

圖像和視頻編輯:Sora 不僅能夠基于文本提示生成視頻,還可以基于現(xiàn)有圖像或視頻進(jìn)行提示。這使得 Sora 能夠執(zhí)行廣泛的圖像和視頻編輯任務(wù),如創(chuàng)建完美循環(huán)的視頻、動(dòng)畫(huà)靜態(tài)圖像、向前或向后擴(kuò)展視頻等。

模擬能力:當(dāng)視頻模型在大規(guī)模訓(xùn)練時(shí),它們展現(xiàn)出了一些有趣的新興能力,使得 Sora 能夠模擬物理世界中的某些方面,如動(dòng)態(tài)相機(jī)運(yùn)動(dòng)、長(zhǎng)期一致性和對(duì)象持久性等。

雖然存在不足之處,但這不是關(guān)鍵

盡管 Sora 展示了作為模擬器的潛力,但它仍然存在許多局限性,例如在模擬基本物理交互時(shí)的準(zhǔn)確性不足。

比如下面這個(gè)由 Sora 生成的視頻當(dāng)中,動(dòng)物的數(shù)量隨著時(shí)間的推移出現(xiàn)了明顯的錯(cuò)亂,多個(gè)動(dòng)物憑空出現(xiàn)又憑空消失了。此外,在一些生成的視頻當(dāng)中還會(huì)出現(xiàn)違反物理規(guī)則的現(xiàn)象。但是,對(duì)于新生的Sora來(lái)說(shuō),這些都不是關(guān)鍵,后續(xù)完全能夠通過(guò)技術(shù)迭代來(lái)進(jìn)行完善和改進(jìn)。

這也是為什么,Sora雖然有一些不完美之處,但是外界仍一致認(rèn)為它將會(huì)革命性地改變?cè)S多行業(yè)。

可以說(shuō),目前的Sora已經(jīng)擁有了足以改變視頻廣告行業(yè)的能力,如果持續(xù)迭代,并在保持穩(wěn)定性和一致性的前提下,進(jìn)一步支持更復(fù)雜的交互、更長(zhǎng)的視頻時(shí)長(zhǎng),并加入更為豐富的AI視頻編輯功能,必將對(duì)于現(xiàn)有的影視制作產(chǎn)業(yè)帶來(lái)革命。

試想一下,如果將一部小說(shuō)輸入Sora就能夠生成一部高質(zhì)量的電影,這將會(huì)是多么的激動(dòng)人心!這將極大的降低視頻創(chuàng)作的門檻,并提升視頻的質(zhì)量,這對(duì)于整個(gè)行業(yè)來(lái)說(shuō)都將帶來(lái)更為積極的意義。當(dāng)然,這也將會(huì)沖擊到現(xiàn)有的傳統(tǒng)視頻制作產(chǎn)業(yè)鏈上的諸多從業(yè)者,恐怕很多演員、導(dǎo)演、攝影師,以及很多相關(guān)的服裝、化妝、道具人員都將要失業(yè)了。

來(lái)源:芯智訊 原文:

https://mp.weixin.qq.com/s/_WIFlmCzQHS4K1fRSkgmYg





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1173

    瀏覽量

    41914
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2140

    瀏覽量

    110724
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48983

    瀏覽量

    248854
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1206

    瀏覽量

    8856
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    473

原文標(biāo)題:一場(chǎng)AI“革命”開(kāi)始,OpenAI文生視頻模型Sora要點(diǎn)分析

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenAI O3與DeepSeek R1:推理模型性能深度分析

    OpenAI剛推出的O3和DeepSeek的R1代表了推理模型領(lǐng)域的重大進(jìn)步。這兩種模型都因在各種基準(zhǔn)測(cè)試中的出色表現(xiàn)而備受關(guān)注,引發(fā)了人們對(duì)人工智能的未來(lái)及其對(duì)各個(gè)行業(yè)的潛在影響的討論。據(jù)我們所知
    的頭像 發(fā)表于 02-18 11:07 ?925次閱讀

    OpenAI即將推出GPT-5模型

    OpenAI首席執(zhí)行官奧爾特曼近日宣布了一項(xiàng)重要消息:OpenAI將在今年未來(lái)幾個(gè)月內(nèi)推出全新的GPT-5模型。這一消息引起了業(yè)界的廣泛關(guān)注和期待。 據(jù)了解,GPT-5模型將整合
    的頭像 發(fā)表于 02-13 11:21 ?580次閱讀

    OpenAI提交新商標(biāo)的申請(qǐng)

    的前沿。2024 年,OpenAI 發(fā)布首個(gè)視頻生成模型 Sora,展示了其在多模態(tài)領(lǐng)域的技術(shù)實(shí)力。此次申請(qǐng)新商標(biāo)
    的頭像 發(fā)表于 02-05 16:38 ?673次閱讀

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項(xiàng)重要進(jìn)展:成功解決了Sora視頻創(chuàng)建過(guò)程中錯(cuò)誤率高的問(wèn)題。這一突破不僅標(biāo)志著OpenAI
    的頭像 發(fā)表于 12-31 10:37 ?521次閱讀

    微軟尋求在365 Copilot中引入非OpenAI模型

    近日,據(jù)路透社報(bào)道,微軟正在積極尋求為其旗艦人工智能產(chǎn)品Microsoft 365 Copilot增加內(nèi)部和第三方的人工智能模型,以減少對(duì)OpenAI底層技術(shù)的依賴,并降低成本。 知情人士透露,微軟
    的頭像 發(fā)表于 12-25 10:41 ?601次閱讀

    騰訊混元文生圖登頂智源FlagEval評(píng)測(cè)榜首

    近日,北京智源人工智能研究院(BAAI)發(fā)布了最新的FlagEval大模型評(píng)測(cè)排行榜,其中多模態(tài)模型評(píng)測(cè)榜單的文生模型引起了廣泛關(guān)注。結(jié)果顯示,騰訊混元的
    的頭像 發(fā)表于 12-25 10:06 ?828次閱讀

    云知聲山海大模型多項(xiàng)評(píng)測(cè)名列前茅

    近日,智源研究院發(fā)布并解讀了國(guó)內(nèi)外100余個(gè)開(kāi)源和商業(yè)閉源的語(yǔ)言、視覺(jué)語(yǔ)言、文生圖、文生視頻、語(yǔ)音語(yǔ)言大模型綜合及專項(xiàng)評(píng)測(cè)結(jié)果。
    的頭像 發(fā)表于 12-24 10:29 ?497次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無(wú)推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型
    的頭像 發(fā)表于 12-20 14:23 ?521次閱讀

    成都匯陽(yáng)投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    、時(shí)長(zhǎng)為20秒的高級(jí)視頻,并且提供去水印功能。 新?Sora?視頻再創(chuàng)作能力大幅提升 ?相較于?OpenAI2?月份發(fā)布的版本,?此次上線的新?So
    的頭像 發(fā)表于 12-16 14:39 ?695次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora
    的頭像 發(fā)表于 12-12 09:40 ?698次閱讀

    OpenAI開(kāi)放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國(guó)及其他市場(chǎng)的ChatGPT Plus訂閱用戶開(kāi)放。自去年首次公開(kāi)預(yù)覽以來(lái),Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)
    的頭像 發(fā)表于 12-10 11:16 ?723次閱讀

    OpenAI世界最貴大模型:昂貴背后的技術(shù)突破

    2023年“雙十二”的第一天,OpenAI推出了其最強(qiáng)推理模型o1的滿血版及其Pro版本。同時(shí),ChatGPT也推出了每月200美元的Pro訂閱計(jì)劃,這一價(jià)格使其一躍成為“世界最貴的大模型”。下面,AI部落小編帶您深入了解
    的頭像 發(fā)表于 12-06 14:46 ?1048次閱讀

    騰訊混元大模型上線并開(kāi)源文生視頻能力

    近日,騰訊宣布其混元大模型正式上線,并開(kāi)源了一項(xiàng)令人矚目的能力——文生視頻。該大模型參數(shù)量高達(dá)130億,支持中英文雙語(yǔ)輸入,為用戶提供了更為便捷和多樣化的
    的頭像 發(fā)表于 12-04 14:06 ?519次閱讀

    OpenAI發(fā)布新型AI文生圖方案sCM,效率大幅提升

    近日,OpenAI公布了一款名為sCM(Continuous-Time Consistency Model)的新型人工智能文生圖方案,為圖像生成領(lǐng)域帶來(lái)了革命性的突破。 與傳統(tǒng)的擴(kuò)散模型相比,sCM
    的頭像 發(fā)表于 10-29 15:09 ?669次閱讀

    Orion模型即將面世,OpenAI采用新發(fā)布模式

    據(jù)最新報(bào)道,OpenAI計(jì)劃在今年12月推出其新款前沿模型,代號(hào)為“Orion”。這款模型將采用與以往不同的發(fā)布模式,引發(fā)廣泛關(guān)注。 與GPT-4o和o1等模型通過(guò)ChatGPT廣泛發(fā)
    的頭像 發(fā)表于 10-25 10:11 ?680次閱讀
    主站蜘蛛池模板: 墨脱县| 加查县| 横山县| 铜川市| 茂名市| 册亨县| 杭锦旗| 昌宁县| 突泉县| 宜州市| 宁晋县| 汾西县| 瑞金市| 古浪县| 磐石市| 济宁市| 新晃| 南靖县| 张家界市| 南丹县| 平原县| 钦州市| 许昌县| 黎平县| 洪湖市| 安化县| 金门县| 香港| 开原市| 通辽市| 阜新| 贵德县| 渭源县| 安塞县| 隆子县| 霍邱县| 大田县| 瓦房店市| 民勤县| 大余县| 塔城市|