在 2025 年春節(jié)期間,科技圈殺出一匹黑馬“DeepSeek”,其迅速火爆全網(wǎng),成為眾人熱議的焦點;回溯過往,人工智能領(lǐng)域能引發(fā)如此廣泛關(guān)注與熱議的現(xiàn)象,或?qū)⒆匪葜?ChatGPT 橫空出世之際。
新春之際,人們的生活需求變得更加多元化和個性化,DeepSeek 的強大功能正好與這些需求高度契合。且超過 60% 的用戶利用它制定旅行攻略,為春節(jié)出行提供了便利。
其中,約 40% 的用戶用它學(xué)習(xí)各地的麻將規(guī)則,增加節(jié)日娛樂的趣味性。近 30% 的用戶借助它進行 “賽博算命”,為春節(jié)增添了一份神秘和歡樂的氛圍。
圖源:Google
首先,DeepSeek是一家專注于開發(fā)先進大語言模型(LLM)和相關(guān)技術(shù)的創(chuàng)新型科技公司?。該公司成立于2023年7月17日,總部位于中國杭州?,聯(lián)合創(chuàng)始人梁文峰擔(dān)任首席執(zhí)行官。
梁文峰自 2007 - 2008 年金融危機期間在浙江大學(xué)就讀時就開始從事交易,2016 年 2 月,他聯(lián)合創(chuàng)立了 High-Flyer,該公司起初主要使用基于 CPU 的線性模型進行股票交易,2016 年 10 月 21 日開始使用依賴 GPU 的深度學(xué)習(xí)模型進行股票交易,到 2017 年底,大部分交易都由人工智能驅(qū)動。
2019 年,梁文峰將 High-Flyer 確立為專注于開發(fā)和使用人工智能交易算法的對沖基金,到 2021 年,該公司在交易中依賴人工智能,且常使用英偉達芯片。
DeepSeek 成立的契機是 2023 年 4 月 14 日,High-Flyer 宣布啟動一個通用人工智能實驗室,致力于研發(fā)與金融業(yè)務(wù)分離的人工智能工具。同年 7 月 17 日,在 High-Flyer 的投資和支持下,該實驗室獨立成為 DeepSeek 公司。但由于風(fēng)險投資公司認(rèn)為該項目難以迅速實現(xiàn) “退出”,所以不太愿意提供資金支持。
值得一提的是,DeepSeek 最吸睛之處的 “黑科技”,將打破常規(guī)的創(chuàng)新之舉。
圖源:X平臺
DeepSeek繞開了主流的 CUDA 生態(tài),直接采用 GPU 低級匯編語言 PTX 對模型進行優(yōu)化,這一操作在行業(yè)內(nèi)引發(fā)巨大轟動,甚至被不少人視為 “技術(shù)革命”。
尤其,從母公司幻方量化的背景來看,這技術(shù)突破有著一定的必然性。幻方作為頭部量化公司,在高頻交易領(lǐng)域長期依賴匯編語言來榨取硬件的極限性能,這種對底層技術(shù)的深度掌控和極致優(yōu)化的基因,自然而然地移植到了 AI 領(lǐng)域。
然而,此操作也有著一定的偶然性,國內(nèi) GPU 算力受限的現(xiàn)狀,成為推動 DeepSeek 采用 PTX 優(yōu)化的重要因素。在算力資源緊張的情況下,尋求新的技術(shù)路徑成為了不二之選。
另外,與國外大廠擁有頂級算力集群不同,國內(nèi)企業(yè)需要另辟蹊徑,PTX 優(yōu)化雖然是一項艱苦的 “苦力活”,但卻為 DeepSeek 帶來了在算力受限環(huán)境下的競爭優(yōu)勢。
與此同時,DeepSeek 出圈的原因,各界已進行了多輪剖析,相關(guān)討論與解讀屢見不鮮 。
圖源:App Store
由于,其模型訓(xùn)練成本大幅削減,僅訓(xùn)練 DeepSeek-V3 模型算力花費不到 600 萬美元,卻能達到與高價模型相當(dāng)?shù)男Ч瑯O大降低了處理推理所需的算力,每 token 僅需 2.78 萬次浮點運算,遠低于行業(yè) 4 萬次的標(biāo)準(zhǔn),還能在低配置硬件上有效運行。
并且支持 Python、C++ 等多種語言,代碼編寫、優(yōu)化及調(diào)試能力強,多輪對話記憶上下文,數(shù)學(xué)推理能力出色,R1 模型在 MMLU 考試中得分達 90.8%,超越 GPT-4。
圖源:Google
當(dāng)然,出圈的AI不是沒有過,但能像DeepSeek這樣,讓英偉達股價暴跌,OpenAI、Google連夜發(fā)布新產(chǎn)品,引發(fā)一系列事件的國產(chǎn)AI,好像僅此一家。
其次,以往美國的傳統(tǒng) AI 大模型多采取閉源策略,限制了技術(shù)的傳播和共享。而 DeepSeek 的開源模式,讓全球開發(fā)者能夠在此基礎(chǔ)上進行創(chuàng)新和二次開發(fā),加速 AI 技術(shù)的發(fā)展進程。
因此,DeepSeek的成功不僅沖擊了美國AI公司長期信奉的“算力至上”和“閉源優(yōu)于開源”的理念,還顛覆了行業(yè)格局。
圖源:X平臺
簡而言之,在硬件資源有限的情況下,DeepSeek通過“更聰明”的算法,消耗更少算力實現(xiàn)更好性能。由此看出,算力資源也的確面臨著缺乏國產(chǎn)化方案的現(xiàn)實難題,自主可控的需求也需要國產(chǎn)算力作為硬支撐。
隨著DeepSeek推出后,其開源和低成本特性,國產(chǎn)顯卡用于推理的性價比急劇上升,進一步鞏固中國算力自主可控的邏輯閉環(huán)逐漸形成,國產(chǎn)算力產(chǎn)業(yè)鏈發(fā)展將大幅加速。
由于篇幅受限,本次的DeepSeek爆火就先介紹這么多......
-
人工智能
+關(guān)注
關(guān)注
1806文章
48956瀏覽量
248469 -
DeepSeek
+關(guān)注
關(guān)注
1文章
793瀏覽量
1611
原文標(biāo)題:驚!DeepSeek 這匹黑馬,如何 “煉就” 國產(chǎn)算力閉環(huán)?
文章出處:【微信號:奇普樂芯片技術(shù),微信公眾號:奇普樂芯片技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
曙光全棧國產(chǎn)DeepSeek一體機方案落地高校
DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用
存力接棒算力,慧榮科技以主控技術(shù)突破AI存儲極限

智界無感·算力覺醒:DeepSeek與BLE技術(shù)融合引爆邊緣AI萬億市場

DeepSeek驅(qū)動AI算力市場升溫,智算中心利用率望提升
濟南市中區(qū)存算一體化智算中心上線DeepSeek
安霸大算力AI芯片接入DeepSeek R1
梯度科技推出DeepSeek智算一體機
添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略
【實測】用全志A733平板搭建一個端側(cè)Deepseek算力平臺
deepseek國產(chǎn)芯片加速 DeepSeek的國產(chǎn)AI芯片天團

軟通動力天元智算接入DeepSeek系列模型
DeepSeek對芯片算力的影響


評論