1. OpenAI終于Open一回:DALL-E 3論文公布、上線ChatGPT,作者一半是華人
原文:https://mp.weixin.qq.com/s/xLvJXe2FDL8YdByZLHjGMQ
打開 ChatGPT 就能用 DALL?E 3 生成圖片了,OpenAI 還罕見地發(fā)布了一些技術(shù)細節(jié)。
終于,「OpenAI 又 Open 了」。在看到 OpenAI 剛剛發(fā)布的 DALL?E 3 相關(guān)論文后,一位網(wǎng)友感嘆說。DALL?E 3 是 OpenAI 在 2023 年 9 月份發(fā)布的一個文生圖模型。與上一代模型 DALL?E 2 最大的區(qū)別在于,它可以利用 ChatGPT 生成提示(prompt),然后讓模型根據(jù)該提示生成圖像。對于不擅長編寫提示的普通人來說,這一改進大大提高了 DALL?E 3 的使用效率。此外,與 DALL?E 2 相比,DALL?E 3 生成的圖質(zhì)量也更高。


- 模型能力的提升主要來自于詳盡的圖像文本描述(image captioning);
- 他們訓(xùn)練了一個圖像文本描述模型來生成簡短而詳盡的文本;
- 他們使用了 T5 文本編碼器;
- 他們使用了 GPT-4 來完善用戶寫出的簡短提示;
- 他們訓(xùn)練了一個 U-net 解碼器,并將其蒸餾成 2 個去噪步驟;
- 文本渲染仍然不可靠,他們認為該模型很難將單詞 token 映射為圖像中的字母





- 使用每種類型的合成描述對性能有什么影響
- 合成描述與真值描述的最佳混合比例是多少?
- 合成與真值描述混合
- 評估方法

2. 在RTX 4090被限制的時代下,讓大模型使用RLHF更高效的方法來了
原文:https://mp.weixin.qq.com/s/3I0kOE1FprOeXSEERVVBIQ
該論文介紹了一種名為 ReMax 的新算法,專為基于人類反饋的強化學(xué)習(xí)(RLHF)而設(shè)計。ReMax 在計算效率(約減少 50% 的 GPU 內(nèi)存和 2 倍的訓(xùn)練速度提升)和實現(xiàn)簡易性(6 行代碼)上超越了最常用的算法 PPO,且性能沒有損失。
- 論文鏈接:https://arxiv.org/abs/2310.10505
- 作者:李子牛,許天,張雨舜,俞揚,孫若愚,羅智泉
- 機構(gòu):香港中文大學(xué)(深圳),深圳市大數(shù)據(jù)研究院,南京大學(xué),南棲仙策
- 開源代碼:https://github.com/liziniu/ReMax







- ReMax 的核心部分可以用 6 行代碼來實現(xiàn)。相比之下,PPO 要額外引入重要性采樣(importance sampling),廣義優(yōu)勢估計(generalized advantage estimation,GAE),價值模型學(xué)習(xí)等額外模塊。
- ReMax 的超參數(shù)很少。相比之下,PPO 有額外的超參數(shù),例如重要性采樣剪切閾值(importance sampling clipping ratio)、GAE 系數(shù)、價值模型學(xué)習(xí)率,離策略訓(xùn)練輪次(off-policy training epoch)等,這些超參數(shù)都需要花大量時間去調(diào)優(yōu)。
- ReMax 能理論上節(jié)省約 50% 內(nèi)存。相比于 PPO,ReMax 成功移除了所有和價值模型相關(guān)的部件,大大減小了內(nèi)存開銷。通過計算,我們發(fā)現(xiàn)相比于 PPO,ReMax 能節(jié)省約 50% 內(nèi)存。
- 更簡單的實現(xiàn):ReMax 的核心部分 6 行代碼即可實現(xiàn)。這與 PPO 中的眾多復(fù)雜的代碼構(gòu)建塊形成鮮明對比。
- 更少的內(nèi)存開銷:由于移除了價值模型及其全部訓(xùn)練組件,相比 PPO,ReMax 節(jié)省了大約 50% 的 GPU 內(nèi)存。
- 更少的超參數(shù): ReMax 成功移除了所有和價值模型訓(xùn)練相關(guān)的超參數(shù),其中包括:GAE 系數(shù)、價值模型學(xué)習(xí)率、重要性采樣時期、小批量(mini-batch)大小。這些超參數(shù)往往對問題敏感且難以調(diào)整。我們相信 ReMax 對 RLHF 研究者更加友好。
- 更快的訓(xùn)練速度:在 GPT2(137M)的實驗中,我們觀察到 ReMax 在真實運行時間方面相比于 PPO 有 2.2 倍的加速。加速來自 ReMax 每次迭代中較少的計算開銷。通過我們的計算,該加速優(yōu)勢在更大的模型上也能維持(假設(shè)在足夠大的內(nèi)存下 PPO 可以被成功部署)。
- 優(yōu)異的性能:如前所示,ReMax在中等規(guī)模實驗中與PPO實現(xiàn)了相當(dāng)?shù)男阅埽⑶矣袝r甚至超越它(可能是由于 ReMax 更容易找到合適的超參數(shù))。我們推測這種良好的性能可以拓展到更大規(guī)模的模型中。
3. 10年市場規(guī)模1.3萬億美元,「模力時代」已來
原文:https://mp.weixin.qq.com/s/ps274X9uf_hTe0UopkGtsg大模型風(fēng)暴刮了大半年,AIGC市場開始起了新的變化:酷炫的技術(shù)Demo,正在被完整的產(chǎn)品體驗所取代。比如,OpenAI最新AI繪畫模型DALL· E 3剛一登場,就跟ChatGPT強強聯(lián)合,成為ChatGPT Plus里最令人期待的新生產(chǎn)力工具。






4. 憶阻器存算一體芯片新突破!有望促進人工智能、自動駕駛等領(lǐng)域發(fā)展
原文:https://mp.weixin.qq.com/s/2BbWRjpu_lreG6TEiG0XKw電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,清華大學(xué)集成電路學(xué)院教授吳華強、副教授高濱團隊基于存算一體計算范式,研制出全球首顆全系統(tǒng)集成的、支持高效片上學(xué)習(xí)的憶阻器存算一體芯片,在支持片上學(xué)習(xí)的憶阻器存算一體芯片領(lǐng)域取得重大突破。該芯片包含支持完整片上學(xué)習(xí)所必需的全部電路模塊,成功完成圖像分類、語音識別和控制任務(wù)等多種片上增量學(xué)習(xí)功能驗證,展示出高適應(yīng)性、高能效、高通用性、高準(zhǔn)確率等特點,有效強化智能設(shè)備在實際應(yīng)用場景下的學(xué)習(xí)適應(yīng)能力,有望促進人工智能、自動駕駛、可穿戴設(shè)備等領(lǐng)域的發(fā)展。什么是憶阻器憶阻器,全稱記憶電阻器(Memristor)。它是表示磁通與電荷關(guān)系的電路器件。憶阻具有電阻的量綱,但和電阻不同的是,憶阻的阻值是由流經(jīng)它的電荷確定。因此,通過測定憶阻的阻值,便可知道流經(jīng)它的電荷量,從而有記憶電荷的作用。1971年,蔡少棠從邏輯和公理的觀點指出,自然界應(yīng)該還存在一個電路元件,它表示磁通與電荷的關(guān)系。2008年,惠普公司的研究人員首次做出納米憶阻器件,掀起憶阻研究熱潮。納米憶阻器件的出現(xiàn),有望實現(xiàn)非易失性隨機存儲器。并且,基于憶阻的隨機存儲器的集成度、功耗、讀寫速度都要比傳統(tǒng)的隨機存儲器優(yōu)越。此外,憶阻是硬件實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)突觸的最好方式。2012年,比勒菲爾德大學(xué)托馬斯博士及其同事制作出一種具有學(xué)習(xí)能力的憶阻器。2013年,安迪·托馬斯利用這種憶阻器作為人工大腦的關(guān)鍵部件,他的研究結(jié)果發(fā)表在《物理學(xué)學(xué)報D輯:應(yīng)用物理學(xué)》雜志上。安迪·托馬斯解釋說,因為憶阻器與突觸的這種相似性,使其成為制造人工大腦——從而打造出新一代電腦——的絕佳材料,“它使我們得以建造極為節(jié)能、耐用,同時能夠自學(xué)的處理器。”托馬斯的文章總結(jié)了自己的實驗結(jié)果,并借鑒其他生物學(xué)和物理學(xué)研究的成果,首次闡述了這種仿神經(jīng)系統(tǒng)的電腦如何將自然現(xiàn)象轉(zhuǎn)化為技術(shù)系統(tǒng),及其中應(yīng)該遵循的幾個原則。這些原則包括,憶阻器應(yīng)像突觸一樣,“注意”到之前的電子脈沖;而且只有當(dāng)刺激脈沖超過一定的量時,神經(jīng)元才會做出反應(yīng),憶阻器也是如此。在國內(nèi),錢鶴、吳華強團隊2012年開始研究用憶阻器來做存儲,但由于憶阻器的材料器件優(yōu)化和集成工藝不成熟,團隊只能靠自己在實驗室里摸索,在一次次失敗的實驗中探索提高器件的一致性和良率。兩年后,清華大學(xué)與中科院微電子所、北京大學(xué)等單位合作,優(yōu)化憶阻器的器件工藝,制備出高性能憶阻器陣列,成為我國率先實現(xiàn)憶阻器陣列大規(guī)模集成的重要基礎(chǔ)。基于憶阻器的新型存算一體架構(gòu)近些年,隨著人工智能應(yīng)用對計算和存儲需求的不斷提升,集成電路芯片技術(shù)面臨諸多新挑戰(zhàn)。一方面,摩爾定律“漸行漸遠”,通過集成電路工藝微縮的方式獲得算力提升越來越難;另一方面,計算與存儲在不同電路單元中完成,會造成大量數(shù)據(jù)搬運的功耗,增加延遲。如何用計算存儲一體化突破AI算力瓶頸,成為近年來國內(nèi)外的科研熱點。過去很多年里,學(xué)術(shù)界和產(chǎn)業(yè)界探索了多種用于實現(xiàn)存算一體的硬件,憶阻器被認為是極具前景的器件之一。吳華強教授此前談到,基于憶阻器的新型存算一體架構(gòu),可以打破算力瓶頸,滿足人工智能等復(fù)雜任務(wù)對計算硬件的高需求。不過,想讓憶阻器陣列實現(xiàn)芯片的功能,還需解決器件、系統(tǒng)、算法等方面的瓶頸。吳華強表示,憶阻器固有的非理想特性,例如器件間波動、器件電導(dǎo)卡滯、電導(dǎo)狀態(tài)漂移等,會導(dǎo)致計算準(zhǔn)確率降低;此外,在架構(gòu)方面,憶阻器陣列實現(xiàn)卷積功能需要以串行滑動的方式連續(xù)采樣、計算多個輸入塊,無法匹配全連接結(jié)構(gòu)的計算效率。從最新的研究成果來看,吳華強團隊似乎解決了這些困難。該團隊創(chuàng)新設(shè)計出適用于憶阻器存算一體的高效片上學(xué)習(xí)的新型通用算法和架構(gòu),研制出全球首顆全系統(tǒng)集成的、支持高效片上學(xué)習(xí)的憶阻器存算一體芯片。相同任務(wù)下,該芯片實現(xiàn)片上學(xué)習(xí)的能耗僅為先進工藝下專用集成電路(ASIC)系統(tǒng)的3%,展現(xiàn)出卓越的能效優(yōu)勢,極具滿足人工智能時代高算力需求的應(yīng)用潛力,為突破馮·諾依曼傳統(tǒng)計算架構(gòu)下的能效瓶頸提供了一種創(chuàng)新發(fā)展路徑。吳華強介紹,存算一體片上學(xué)習(xí)在實現(xiàn)更低延遲和更低能耗的同時,能夠有效保護用戶隱私和數(shù)據(jù)。該芯片參照仿生類腦處理方式,可實現(xiàn)不同任務(wù)的快速“片上訓(xùn)練”與“片上識別”,能夠有效完成邊緣計算場景下的增量學(xué)習(xí)任務(wù),以極低的耗電適應(yīng)新場景、學(xué)習(xí)新知識,滿足用戶的個性化需求。小結(jié)近幾年,人工智能技術(shù)的發(fā)展對算力的需求越來越高,同時傳統(tǒng)計算架構(gòu)的瓶頸也越來越明顯,學(xué)術(shù)界和產(chǎn)業(yè)界都在積極探索新的發(fā)展模式來解決這一問題,存算一體技術(shù)憑借突出的能效比優(yōu)勢脫穎而出。而在實現(xiàn)存算一體的各類器件中,憶阻器的先天優(yōu)勢明顯。此次清華大學(xué)研制出支持片上學(xué)習(xí)的憶阻器存算一體芯片,意義重大。
5. 美國AI芯片出口管制再升級,A800/H800禁止對大陸出口,國產(chǎn)GPU發(fā)展勢在必行!
原文:https://mp.weixin.qq.com/s/1snqc5TKjPajcUz4ELIO6w10月17日,美國商務(wù)部工業(yè)與安全局(BIS)發(fā)布更新針對人工智能(AI)芯片的出口管制規(guī)定。該計劃不僅限制英偉達等公司向中國出口先進的AI芯片,還可能阻礙ASML、應(yīng)用材料、泛林和KLA等向中國銷售和出口半導(dǎo)體制造設(shè)備。與此同時,BIS周二還在《聯(lián)邦公報》刊登了一份定于10月19日發(fā)布的行政措施,準(zhǔn)備將13家中國公司添加到出口管制名單,即所謂的“實體清單”。其中包括北京壁仞科技開發(fā)有限公司、摩爾線程智能科技(北京)有限責(zé)任公司兩家中國GPU企業(yè)。英偉達A100 / A800 / H100 / H800 / L40 / L40S / RTX 4090等產(chǎn)品都將受限美國商務(wù)部長吉娜·雷蒙多(Gina Raimondo)稱,新措施填補了去年10月發(fā)布法規(guī)中的漏洞,并表示這些措施未來可能至少每年更新一次。她表示,美國限制的目標(biāo)是阻止中國獲得先進的半導(dǎo)體,這些半導(dǎo)體可能推動中國人工智能和精密計算機的突破。去年10月,美國對出口中國的AI芯片實施帶寬速率限制。根據(jù)當(dāng)時英偉達發(fā)布的公告,美國通知該公司向中國出口A100和H100芯片將需要新的許可證要求,同時DGX或任何其他包含A100或H100芯片的產(chǎn)品,以及未來性能高于A100的芯片都將受到新規(guī)管制。A100是英偉達2020年推出的數(shù)據(jù)中心級云端加速芯片,支持FP16、FP32和FP64浮點運算,為人工智能、數(shù)據(jù)分析和HPC數(shù)據(jù)中心等提供算力。H100是英偉達2022年推出的最新一代數(shù)據(jù)中心GPU,H100在FP16、FP32和FP64計算上比A100快三倍,非常適用于當(dāng)下流行且訓(xùn)練難度高的大模型。當(dāng)時國內(nèi)高端場景基本采用英偉達的A100,不少主流廠商也預(yù)定了計劃在2022年下半年發(fā)貨的H100。然而美國政府去年10月發(fā)布的法規(guī),讓這些廠商在一些高端應(yīng)用上面臨無合適芯片可用的局面。不過之后,英偉達向中國企業(yè)提供了替代版本A800和H800,用以解決美國商務(wù)部的半導(dǎo)體出口新規(guī)。根據(jù)美國商務(wù)部去年10月的發(fā)布的法規(guī),主要限制的是顯卡的算力和帶寬,算力上線是4800 TOPS,帶寬上線是600 GB/s。英偉達新發(fā)布的A800的帶寬為400GB/s,低于A100的600GB/s,H800雖然參數(shù)未公布,但據(jù)透露只約到H100(900 GB/s)的一半。這意味著A800、H800在進行AI模型訓(xùn)練的時候,需要耗費更長的時間,不過相對來說,也已經(jīng)很好了。然而,盡管A800、H800對關(guān)鍵性能進行了大幅限制。但美國政府認為,H800在某些情況下算力仍然不亞于H100。為了進一步加強對AI芯片的出口管制,美國計劃用多項新的標(biāo)準(zhǔn)來替換掉之前針對“帶寬參數(shù)”(Bandwidth Parameter)提出的限制,盡管這已經(jīng)大大降低了AI芯片之間的通信速率,增加了AI開發(fā)的難度和成本。根據(jù)新規(guī),美國商務(wù)部計劃引入一項被稱為“性能密度”(performance density)的參數(shù),來防止企業(yè)尋找到變通的方案,修訂后的出口管制措施將禁止美國企業(yè)向中國出售運行速度達到300 teraflops(即每秒可計算 3億次運算)及以上的數(shù)據(jù)中心芯片。新措施還旨在防止企業(yè)通過Chiplet的芯片堆疊技術(shù)繞過芯片限制。針對美國政府此次發(fā)布的新規(guī),英偉達公司依規(guī)發(fā)布了8-K文件,對出口管制做出了解釋。英偉達稱,此次出口管制涉及的產(chǎn)品包括但不限于:A100、A800、H100、H800、L40、L40S 以及RTX 4090。任何集成了一個或多個以上芯片的系統(tǒng),包括但不限于英偉達DGX、HGX系統(tǒng),也在新規(guī)涵蓋范圍之內(nèi)。此外,美國政府還將要求企業(yè)獲得向40多個國家/地區(qū)出售芯片的許可證,以防止中國企業(yè)從海外其他國家和地區(qū)獲得先進芯片。美國政府還對中國以外的21個國家提出了芯片制造設(shè)備的許可要求,并擴大了禁止進入這些國家和地區(qū)的設(shè)備清單。同時,美國還將13家中國公司添加到出口管制名單,其中,壁仞科技、摩爾線程兩家GPU企業(yè)在列。發(fā)展國產(chǎn)GPU等大算力芯片勢在必行美國政府此次對人工智能芯片的出口管制升級,對中國相關(guān)產(chǎn)業(yè)發(fā)展有何影響?中國主要的互聯(lián)網(wǎng)大廠、云服務(wù)廠商基本都依賴英偉達的GPU。尤其是近年來隨著ChatGPT的出圈,國內(nèi)各大互聯(lián)網(wǎng)公司、AI企業(yè)都在大力自研AI大模型產(chǎn)品,這更是加大了對英偉達GPU的需求。由于去年A100就已經(jīng)被禁,今年上半年各大互聯(lián)網(wǎng)廠商都在爭相采購A800。不過從目前的情況來看,新規(guī)對各大廠商短期的影響倒是不明顯。多家廠商對媒體表示,已經(jīng)提前接到消息,不少廠商已經(jīng)預(yù)先進行囤貨。一家服務(wù)器廠商的內(nèi)部人士表示,公司囤了足夠的量。騰訊、百度等大廠也囤貨充足。一家上市公司17日晚間發(fā)布公告稱,其控股子公司向其供應(yīng)商采購了75臺H800及22臺A800現(xiàn)貨。該公司對媒體表示,已經(jīng)在兩周前就解決了這個問題。國內(nèi)一些大模型創(chuàng)業(yè)企業(yè)也已經(jīng)提前做了準(zhǔn)備,比如智譜AI,該公司表示公司囤貨充足。不過依靠囤貨畢竟不是長久之計,有廠商表示,雖然吞了足夠的量,不過未來還是有很大壓力。美國此次新規(guī)的發(fā)布意味著其對我國算力的進一步遏制,這對如今備受重視的大模型的發(fā)展也將會有所限制。從長遠來看,國產(chǎn)GPU等大算力芯片的發(fā)展才是關(guān)鍵。事實上,過去這些年美國不斷升級出口管制,國內(nèi)企業(yè)已經(jīng)逐步傾向于采用***,國內(nèi)的芯片企業(yè)也在政策的支持下,下游企業(yè)更多的采用下,技術(shù)和產(chǎn)品也得到更多迭代,發(fā)展越來越好。比如,智譜AI雖然屯了足夠的芯片,同時它也為配合國產(chǎn)GPU發(fā)展,同步落地GLM(通用語言模型)***適配計劃,可適配10余種***等。當(dāng)前,國內(nèi)已經(jīng)有一些芯片可以支持大模型的訓(xùn)練和推理,長此發(fā)展下去,未來的性能、生態(tài)也一定會越來越成熟。從美國此次新規(guī)將壁仞科技、摩爾線程等公司列入實體清單,可以看出美國對中國GPU芯片快速發(fā)展的擔(dān)憂。當(dāng)然這也意味著,未來中國大算力芯片的進一步突破,也將面臨著更大的困難,這需要設(shè)備、制造等產(chǎn)業(yè)鏈各環(huán)節(jié)的同步升級。小結(jié)為了阻止中國先進技術(shù)的發(fā)展,美國無休止的實施出口管制。這確實在短期內(nèi)阻礙了一些企業(yè)的發(fā)展,不過從過去幾年的情況來看,美國的出口限制,也進一步促進了中國芯片產(chǎn)業(yè)的發(fā)展。未來,中國企業(yè)也同樣會不斷進行探索,以應(yīng)對美方的打壓。除了對中國企業(yè)造成影響之外,美方不當(dāng)管制嚴重阻礙了各國芯片及芯片設(shè)備、材料、零部件企業(yè)正常經(jīng)貿(mào)往來,嚴重破壞了市場規(guī)則和國際經(jīng)貿(mào)秩序,威脅到全球產(chǎn)業(yè)鏈供應(yīng)鏈穩(wěn)定。美國自己的企業(yè)也損失巨大,比如英偉達,雖然該公司表示短期內(nèi)財務(wù)業(yè)務(wù)新規(guī)影響較小,但是要知道其接近50%的收入來自中國,此次新規(guī)將幾乎阻斷英偉達大部分中國業(yè)務(wù)的開展。除此之外,因為美國的不當(dāng)管制,其他國家的半導(dǎo)體企業(yè)也深受其害。
6. 超火迷你GPT-4視覺能力暴漲,GitHub兩萬星,華人團隊出品
原文:https://mp.weixin.qq.com/s/nG3otCtN1mwSHKXEw-0vxwGPT-4V來做目標(biāo)檢測?網(wǎng)友實測:還沒有準(zhǔn)備好。












———————End———————
點擊閱讀原文進入官網(wǎng)
原文標(biāo)題:【AI簡報20231020期】出自華人之手:DALL-E 3論文公布、上線ChatGPT!超火迷你GPT-4
文章出處:【微信公眾號:RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
RT-Thread
+關(guān)注
關(guān)注
32文章
1400瀏覽量
41824
原文標(biāo)題:【AI簡報20231020期】出自華人之手:DALL-E 3論文公布、上線ChatGPT!超火迷你GPT-4
文章出處:【微信號:RTThread,微信公眾號:RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AI真會人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關(guān)已開啟

樹莓派 也能搞 AI 藝術(shù)?樹莓派遇上DALL-E,開啟你的 AI 藝術(shù)創(chuàng)作之旅!

從性能到商業(yè),Grok3、GPT-4o、DeepSeek如何重塑AI版圖?

OpenAI簡化大模型選擇:薩姆·奧特曼制定路線圖
OpenAI宣布GPT 4o升智計劃
ChatGPT Plus 2025新功能搶先看:如何訂閱與使用全攻略
OpenAI即將發(fā)布GPT-4.5與GPT-5
OpenAI將發(fā)布更智能GPT模型及AI智能體工具
一文說清楚什么是AI大模型


評論