美國南方衛(wèi)理公會大學(xué)使用 NVIDIA DGX SuperPOD 推動德克薩斯州北部地區(qū)進(jìn)入 AI 時代;密西西比州立大學(xué)和德克薩斯農(nóng)工大學(xué)準(zhǔn)備使用 NVIDIA Quantum-2 網(wǎng)絡(luò);英國的一所大學(xué)則升級了其 InfiniBand 網(wǎng)絡(luò)。
正如達(dá)拉斯/沃斯堡機場已成為全美旅行樞紐一樣,南方衛(wèi)理公會大學(xué)(SMU)將助力德克薩斯州北部地區(qū)在 AI 行業(yè)發(fā)展中處于領(lǐng)先地位。
南方衛(wèi)理公會大學(xué)正在安裝一臺 NVIDIA DGX SuperPOD 超級計算機。該大學(xué)希望這臺超級計算機為這個擁有 12000 多名學(xué)生和 2400 名教職員工的龐大社區(qū)推動機器學(xué)習(xí)項目的發(fā)展。
除了該大學(xué)之外,美國中南部還有兩所大學(xué)也宣布計劃使用 NVIDIA 技術(shù)以推動研究高速發(fā)展。
德克薩斯農(nóng)工大學(xué)和密西西比州立大學(xué)均計劃使用 NVIDIA 的 400 Gbit/s InfiniBand 網(wǎng)絡(luò)平臺,NVIDIA Quantum-2 將作為其最新高性能計算機的主干網(wǎng)。此外,英國的一臺超級計算機剛剛升級了其 InfiniBand 網(wǎng)絡(luò)。
德克薩斯州喜獲 SuperPOD
提到今年早期在佛羅里達(dá)大學(xué)安裝的另一個系統(tǒng)時,南方衛(wèi)理公會大學(xué)首席信息官 Michael Hites 表示:“我們是美國第二所獲得 DGX SuperPOD 系統(tǒng)的大學(xué),它將助力本社區(qū)在使用 AI 技術(shù)推動學(xué)位課程,以及校企合作方面,均處于領(lǐng)先地位。”
9 月,一篇報導(dǎo)稱,達(dá)拉斯地區(qū)因缺乏主要的 AI 研究而 “步履蹣跚”。巧合的是,報導(dǎo)登上當(dāng)?shù)貓蠹堉畷r,也正是南方衛(wèi)理公會大學(xué)敲定其 DGX SuperPOD 計劃之日。
南方衛(wèi)理公會大學(xué)在 3 月的一份計劃預(yù)覽報告中表示,AI 是 “數(shù)字化轉(zhuǎn)型的核心……沒有任何社會部門能夠不受該技術(shù)的影響。AI 對 K-12 教育行業(yè)和勞動力發(fā)展具有巨大的改善潛力,這將有助于該地區(qū)經(jīng)濟(jì)的持續(xù)增長。”
一項 15 億美元的籌款活動 —— SMU Ignite —— 于 9 月正式啟動。SMU Ignite 將推動 AI 倡議,幫助南方衛(wèi)理公會大學(xué)邁入全國頂級研究型大學(xué)的行列。該大學(xué)正在聘請一位首席創(chuàng)新官來協(xié)助指導(dǎo)此項工作。
打造一個計算煉金爐
南方衛(wèi)理公會大學(xué)研究者 IT 支持團(tuán)隊主管 Jason Warner 表示,這項工作的核心是人才。因此,他為南方衛(wèi)理公會大學(xué)福特研究與創(chuàng)新中心的一個新中心聘請了一批具有重大影響力的數(shù)據(jù)科學(xué)專家。Warner 將這座新中心稱為南方衛(wèi)理公會大學(xué)的 “計算煉金爐”。
這支團(tuán)隊由 Eric Godat 領(lǐng)導(dǎo),他在南方衛(wèi)理公會大學(xué)使用大型強子對撞機的數(shù)據(jù)為核結(jié)構(gòu)建模,并因此獲得了粒子物理學(xué)博士學(xué)位。
而今,他正協(xié)助南方衛(wèi)理公會大學(xué)的學(xué)生了解 DGX SuperPOD 所帶來的新機會。第一步,他邀請兩名南方衛(wèi)理公會大學(xué)的學(xué)生使用 NVIDIA Jetson 模塊建造一個 DGX SuperPOD 的微型模型。
Godat 表示:“我們想讓大家感受一下未來的工作會是什么樣子的,尤其是那些沒有做過 AI 方面工作的非技術(shù)領(lǐng)域人員。”
南方衛(wèi)理公會大學(xué)本科生 Connor Ozenne 協(xié)助建立了一個微型 DGX SuperPOD,南方衛(wèi)理公會大學(xué)年度報告中對其進(jìn)行了介紹。這臺微型系統(tǒng)由 16 個 Jetson 模塊組成,學(xué)生們將把它看作一個 TOP500 系統(tǒng)來運行 benchmark 測試
這臺全尺寸超級計算機由建立在NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上的20個NVIDIA DGX A100 系統(tǒng)組成。憑借其積木式的模塊化結(jié)構(gòu),這臺超級計算機最早可以在 1 月啟動和運行。它將提供高達(dá) 100PFlops 的計算力,足以使其在全球最快超級計算機榜單 TOP500上位居前列。
德克薩斯農(nóng)工大學(xué)為其 ACES
使用 NVIDIA Quantum-2 InfiniBand 技術(shù)
位于南面約 200英里的德克薩斯農(nóng)工大學(xué)高性能計算中心,將成為首批接入 NVIDIA Quantum-2 InfiniBand 平臺的機構(gòu)之一。其 ACES 超級計算機由戴爾科技建造,將使用 400G InfiniBand 網(wǎng)絡(luò)為研究者連接來自四家廠商的五個加速器。
NVIDIA Quantum-2 確保“在 ACES 上單項工作即可以擴(kuò)展到所有計算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它還具有更低的總擁有成本、更強大的網(wǎng)絡(luò)計算功能和更高的擴(kuò)展性”,ACES 首席研究員兼項目總監(jiān) Honggao Liu 表示。
德克薩斯農(nóng)工大學(xué)已經(jīng)為研究者提供了四套加速計算系統(tǒng),這四套系統(tǒng)包含 600多個 NVIDIA A100 Tensor Core 和上一代 GPU,其中兩個系統(tǒng)使用了較早版本的 NVIDIA InfiniBand 技術(shù)。
密西西比州立大學(xué)乘上 400G 網(wǎng)速列車
密西西比州立大學(xué)也將使用 NVIDIA Quantum-2 InfiniBand 平臺。它是構(gòu)建 Orion 新系統(tǒng)的首選網(wǎng)絡(luò),Orion 是密西西比州立大學(xué)管理的四個集群中最大的一個集群,這四個集群全部使用較早版本的 InfiniBand 網(wǎng)絡(luò)所構(gòu)建。
Orion 和新系統(tǒng)均由美國國家海洋和大氣管理局(NOAA)所資助,由戴爾科技建造。Orion 和新系統(tǒng)將承擔(dān) NOAA 的工作任務(wù),以及密西西比州立大學(xué)的各項研究課題。
Orion 在 2019 年 6 月首次登上 TOP500榜單,并被列為美國第四大學(xué)術(shù)超級計算機。
密西西比州立大學(xué)高性能計算總監(jiān) Trey Breckenridge 表示:“我們在密西西比州立大學(xué)的四代超級計算機中都使用了 InfiniBand,所以我們知道它既強大又成熟,可以可靠地運行我們需要的大型工作。”
他補充道:“我們正在添加一套使用 NVIDIA Quantum-2 的新系統(tǒng),以保持在高性能計算領(lǐng)域的領(lǐng)先優(yōu)勢。”
Quantum 在英國掀起風(fēng)潮
在大洋彼岸的英國,萊斯特大學(xué)的數(shù)據(jù)密集型超級計算機—— DIaL 系統(tǒng)——已經(jīng)升級到 200G 版本的 NVIDIA Quantum InfiniBand。
萊斯特大學(xué)理論天體物理學(xué)教授兼高性能計算中心總監(jiān) Mark Wilkinson 表示:“ DIaL專為解決復(fù)雜的數(shù)據(jù)密集型問題而設(shè)計,我們需要解決這些問題,才能推進(jìn)對周圍宇宙的理解。”
“這些專業(yè)應(yīng)用對帶寬和延遲的要求都是前所未有的,只有 InfiniBand 能夠滿足要求,使研究工作有效開展。”
DIaL 是英國 DiRAC 設(shè)施中使用 InfiniBand 的四臺超級計算機之一,另外還包括愛丁堡大學(xué)的 Tursa 系統(tǒng)。
InfiniBand 在技術(shù)評估上表現(xiàn)出色
在一次技術(shù)評估中,研究人員發(fā)現(xiàn)與使用另一種互連方式的純CPU系統(tǒng)Tesseract相比,在由Quantum網(wǎng)絡(luò)和NVIDIA GPU加速器構(gòu)建的Tursa系統(tǒng)上運行應(yīng)用性能可達(dá)5倍提升。
基準(zhǔn)應(yīng)用測試顯示,Tursa系統(tǒng)上16個節(jié)點的性能是Tesseract系統(tǒng)上512個節(jié)點性能的兩倍。Tursa系統(tǒng)的每個節(jié)點提供10 TFlops計算性能,使用90%的網(wǎng)絡(luò)帶寬,每千瓦性能相比Tesseract有顯著的提高。
這也說明了為什么世界上大多數(shù) TOP500 系統(tǒng)都在使用NVIDIA的技術(shù)。
責(zé)任編輯:haq
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5292瀏覽量
106190 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7804瀏覽量
90752
原文標(biāo)題:SC21 | 多所大學(xué)采用 NVIDIA 系統(tǒng)和網(wǎng)絡(luò)拓展研究工作
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學(xué)發(fā)展

如何在Ubuntu上安裝NVIDIA顯卡驅(qū)動?

英偉達(dá)GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新
傳音控股入選2024新經(jīng)濟(jì)企業(yè)TOP500
為什么高壓電機大多數(shù)采用星型接法?

軟通動力榮登“新經(jīng)濟(jì)企業(yè)500強”榜單
海格通信榮獲2024中國新經(jīng)濟(jì)企業(yè)TOP500強
GaNSafe–世界上最安全的GaN功率半導(dǎo)體

NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布
ADS8472采集進(jìn)來的數(shù)據(jù)大多數(shù)是1039(040F),3087(0C0F),為什么?
世界上最貴的錫膏-金錫(Au80Sn20)

NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機

《算力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔:從基準(zhǔn)測試到CPU微架構(gòu)的深度探索
未來車間大多數(shù)人工將被機器代替,立柱機器人建材行業(yè)應(yīng)用

評論