女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

曠視AI開源新突破:上傳照片即可生成表情包視頻!

AI機(jī)械姬 ? 來源:AI機(jī)械姬 ? 作者:AI機(jī)械姬 ? 2024-07-12 11:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,曠視科技發(fā)布了一項(xiàng)新的開源AI人像視頻生成框架——MegActor。該框架讓用戶只需輸入一張靜態(tài)肖像圖片和一段視頻(如演講、表情包、rap),便可生成一段表情豐富、動(dòng)作一致的AI人像視頻。生成的視頻長度取決于輸入的視頻長度。與阿里EMO、微軟VASA等最新AI視頻模型不同,曠視MegActor采用開源方式,供開發(fā)者社區(qū)使用。MegActor生成的視頻畫質(zhì)更出色,面部細(xì)節(jié)更加豐富自然。

wKgZomaQp8CARJnFAAAUzJBUboU053.png

為了展示其泛化性,MegActor甚至可以將VASA中的人物肖像和視頻組合生成,得到生動(dòng)的表情視頻。即使與阿里EMO的官方案例相比,MegActor也能生成近似的效果。

wKgaomaQp0qAR1g4AAGuNBaURo8083.png

總的來說,無論是讓肖像開口說話、唱歌、模仿搞怪表情包,MegActor都能生成逼真的效果。

論文鏈接:https://arxiv.org/abs/2405.20851

代碼地址:https://github.com/megvii-research/megactor

項(xiàng)目地址:https://megactor.github.io/

MegActor是曠視研究院的最新研究成果。曠視研究院是曠視公司級研究機(jī)構(gòu),旨在通過基礎(chǔ)創(chuàng)新突破AI技術(shù)邊界,以工程創(chuàng)新實(shí)現(xiàn)技術(shù)到產(chǎn)品的快速轉(zhuǎn)化。多年來,曠視研究院已成為全球領(lǐng)先的人工智能研究機(jī)構(gòu)。

目前的人像視頻生成領(lǐng)域中,許多工作通常使用高質(zhì)量的閉源數(shù)據(jù)進(jìn)行訓(xùn)練,以追求更好的效果。而曠視研究院始終堅(jiān)持全面開源,確保實(shí)際效果的可復(fù)現(xiàn)性。MegActor的訓(xùn)練數(shù)據(jù)全部來自公開可獲取的開源數(shù)據(jù)集,配合開源代碼,使得感興趣的從業(yè)者可以從頭開始完整復(fù)現(xiàn)這些效果。

為了完全復(fù)刻原始視頻的表情和動(dòng)作,MegActor采用原始圖像進(jìn)行驅(qū)動(dòng),這與多數(shù)廠商使用的中間表示方法(如sketch、pose、landmark)不同,能夠捕捉到細(xì)致的表情和運(yùn)動(dòng)信息。

曠視科技研究總經(jīng)理范浩強(qiáng)表示,在AI視頻生成領(lǐng)域,我們發(fā)現(xiàn)目前主流的骨骼關(guān)鍵點(diǎn)控制方式不僅要求用戶提供難以獲取的專業(yè)控制信號,同時(shí)生成視頻的保真度也不盡如人意。通過研究發(fā)現(xiàn),使用原視頻進(jìn)行驅(qū)動(dòng),不僅降低了控制信號的門檻,更能生成保真且動(dòng)作一致的視頻。

具體來說,MegActor主要由兩個(gè)階段構(gòu)成:

wKgaomaQp2yAMbsSAAINHxF7tf0305.png

使用ReferenceNet對參考圖像進(jìn)行特征提取,獲取參考圖像的外觀和背景信息;

使用PoseGuider對輸入視頻進(jìn)行運(yùn)動(dòng)和表情信息提取,將這些信息遷移到參考圖像上。

雖然使用原始視頻進(jìn)行驅(qū)動(dòng)能帶來更豐富的表情細(xì)節(jié)和運(yùn)動(dòng)信息,但也存在ID泄露和背景干擾等挑戰(zhàn)。為此,MegActor采用了條件擴(kuò)散模型,引入了合成數(shù)據(jù)生成框架,創(chuàng)建具有一致動(dòng)作和表情但不同身份ID的視頻,以減輕ID泄露的問題。MegActor還分割了參考圖像的前景和背景,并使用CLIP對背景細(xì)節(jié)進(jìn)行編碼,確保背景的穩(wěn)定性。

在數(shù)據(jù)訓(xùn)練方面,曠視研究院團(tuán)隊(duì)使用公開數(shù)據(jù)集(VFHQ和CeleV)進(jìn)行訓(xùn)練,總時(shí)長超過700小時(shí)。為了避免ID泄露問題,團(tuán)隊(duì)還使用換臉和風(fēng)格化方法1:1生成合成數(shù)據(jù),實(shí)現(xiàn)表情和動(dòng)作一致但I(xiàn)D不一致的數(shù)據(jù)。此外,團(tuán)隊(duì)使用注視檢測模型處理數(shù)據(jù),獲取大約5%的高質(zhì)量數(shù)據(jù)進(jìn)行Finetune訓(xùn)練。

wKgaomaQp4-Ad7nyAAIrJv12wFw194.png

通過新的模型框架和訓(xùn)練方法,曠視研究院團(tuán)隊(duì)僅使用了不到200塊V100顯卡小時(shí)的訓(xùn)練時(shí)長,最終實(shí)現(xiàn)了以下特性:

根據(jù)輸入視頻生成任意持續(xù)時(shí)間的模仿視頻,確保角色身份一致性;

支持各種驅(qū)動(dòng)視頻,如演講、唱歌、表情包等;

支持不同畫風(fēng)(照片、傳統(tǒng)繪畫、漫畫、AI數(shù)字人等);

音頻生成方法相比,MegActor生成的視頻不僅能確保表情和動(dòng)作一致,更能達(dá)到自然程度。

目前,MegActor已經(jīng)完全開源,供開發(fā)者和用戶即開即用。



審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34808

    瀏覽量

    277215
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3649

    瀏覽量

    43676
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    發(fā)布AIS算法生產(chǎn)平臺V5.0版本

    近日,正式發(fā)布自研的算法生產(chǎn)平臺AIS(AI Service)5.0版!此次升級,包括接入DeepSeek等三大核心能力重磅亮相,助力企業(yè)AI生產(chǎn)力再躍升!
    的頭像 發(fā)表于 03-12 17:18 ?697次閱讀

    運(yùn)動(dòng)猿入選2024年度智能體育典型案例

    2025年3月3日,工業(yè)和信息化部、國家體育總局聯(lián)合公布了“2024年度智能體育典型案例”名單,“運(yùn)動(dòng)猿智能體育教育產(chǎn)品方案”成功入選,成為智能青少年體育產(chǎn)品方向的典型案例。此次獲評是對
    的頭像 發(fā)表于 03-10 10:04 ?467次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    AI助手”功能。 根據(jù)需求選擇助手類型,例如應(yīng)用助手、知識助手或?qū)υ捴帧τ?b class='flag-5'>視頻生成應(yīng)用,可能需要結(jié)合應(yīng)用助手和對話助手的功能。 完成助手的基礎(chǔ)配置,包括動(dòng)作意圖、知識庫和對話模型等。這里可以上傳
    發(fā)表于 03-05 19:52

    AI賦能銳測控平臺

    自2016年成立以來,簡儀科技致力于打造基于開源技術(shù)的銳測控平臺(SeeSharp Platform),建設(shè)測控開源生態(tài)圈。得益于OpenAI、ChatGPT、DeepSeek、通義千問等A
    的頭像 發(fā)表于 02-10 09:23 ?481次閱讀
    <b class='flag-5'>AI</b>賦能銳<b class='flag-5'>視</b>測控平臺

    國內(nèi)生成AI備案數(shù)量突破300款

    服務(wù)數(shù)量高達(dá)238款,占據(jù)了總備案數(shù)量的絕大部分,充分展示了該領(lǐng)域技術(shù)創(chuàng)新和市場需求的強(qiáng)勁動(dòng)力。這一快速增長不僅反映了國內(nèi)企業(yè)在生成AI技術(shù)上的不斷突破,也體現(xiàn)了市場對該類服務(wù)的廣泛認(rèn)可和熱烈追捧。 除了直接備案的
    的頭像 發(fā)表于 01-09 11:14 ?828次閱讀

    中標(biāo)北京市大數(shù)據(jù)中心感知管理服務(wù)平臺二期建設(shè)項(xiàng)目

    近日,成功中標(biāo)北京市大數(shù)據(jù)中心感知管理服務(wù)平臺(二期)建設(shè)項(xiàng)目,此次中標(biāo)不僅是對技術(shù)實(shí)力和服務(wù)能力的認(rèn)可,更標(biāo)志著
    的頭像 發(fā)表于 12-31 09:20 ?739次閱讀

    Lightricks與Shutterstock攜手,推動(dòng)開源LTXV視頻人工智能生成視頻模型發(fā)展

    ,Lightricks將能夠利用高質(zhì)量HD和4K視頻素材,進(jìn)一步訓(xùn)練其開源視頻生成模型——LTX Video(LTXV)。 Lightricks成為首個(gè)在Shutterstock行業(yè)首創(chuàng)
    的頭像 發(fā)表于 12-15 09:31 ?470次閱讀
    Lightricks與Shutterstock攜手,推動(dòng)<b class='flag-5'>開源</b>LTXV<b class='flag-5'>視頻</b>人工智能<b class='flag-5'>生成</b>式<b class='flag-5'>視頻</b>模型發(fā)展

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發(fā)表于 12-12 09:40 ?677次閱讀

    亮相2024數(shù)字科技生態(tài)大會

    2024數(shù)字科技生態(tài)大會上,展示了多項(xiàng)聯(lián)網(wǎng)領(lǐng)域的前沿技術(shù)及應(yīng)用成果,包括大模型、行業(yè)場景方案以及創(chuàng)新智能終端。
    的頭像 發(fā)表于 12-06 10:34 ?692次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動(dòng)生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?702次閱讀

    重慶兩江新區(qū)與吉利汽車集團(tuán)、科技簽署合作協(xié)議

    日前,重慶兩江新區(qū)與吉利汽車集團(tuán)、科技簽署戰(zhàn)略合作協(xié)議。市委書記袁家軍,市委副書記、市長胡衡華會見了吉利控股集團(tuán)董事長李書福、科技董事長兼CEO印奇一行并見證簽約。
    的頭像 發(fā)表于 09-02 14:13 ?838次閱讀

    三行代碼完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個(gè)安裝分別是基礎(chǔ)生成AI支持,新發(fā)布的Ge
    的頭像 發(fā)表于 08-30 16:49 ?731次閱讀
    三行代碼完成<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>部署

    聚焦物聯(lián)網(wǎng)場景,科技核心技術(shù)能力持續(xù)升級

    曾經(jīng)備受青睞的“AI四小龍”之一,科技在更早的時(shí)候曾向港交所遞交上市申請,闖關(guān)未果后轉(zhuǎn)向上交所科創(chuàng)板。 ? 科技核心技術(shù)能力 ?
    的頭像 發(fā)表于 07-25 00:09 ?4910次閱讀

    MediaTek與快手?jǐn)y手創(chuàng)新,端側(cè)視頻生成技術(shù)引領(lǐng)AI新紀(jì)元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項(xiàng)重大技術(shù)突破——高效端側(cè)視頻生成技術(shù)的誕生。這項(xiàng)技術(shù)不僅是對即將于2024年世界移動(dòng)通信大會(MWC 2024)上亮相的先進(jìn)視頻生成技術(shù)的有力延續(xù),更是雙方在
    的頭像 發(fā)表于 07-05 11:52 ?1703次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    只需在設(shè)備上選取圖片,應(yīng)用即可智能地識別照片中的人物和場景,生成自然流暢的視頻佳作,從而顯著提升視頻制作的創(chuàng)意表現(xiàn)和效率。
    的頭像 發(fā)表于 07-05 11:23 ?1.1w次閱讀
    主站蜘蛛池模板: 衡阳市| 铜川市| 常山县| 雷山县| 衢州市| 宝鸡市| 泗洪县| 察雅县| 霞浦县| 金阳县| 阜平县| 万源市| 荃湾区| 依安县| 治县。| 太白县| 留坝县| 余江县| 梧州市| 陵川县| 大庆市| 遵化市| 多伦县| 景德镇市| 长寿区| 华阴市| 宣化县| 西吉县| 克什克腾旗| 无极县| 昌图县| 永嘉县| 福清市| 泰和县| 侯马市| 五台县| 杭锦旗| 武乡县| 赤城县| 阳城县| 年辖:市辖区|