NEWS
新聞詳情
DeepSeek引發(fā)科技圈震動(dòng)后,國(guó)內(nèi)公司開(kāi)始排隊(duì)購(gòu)買服務(wù)器,本地部署DeepSeekAI模型,導(dǎo)致英偉達(dá)特供大陸的H20 GPU直接“爆單”。服務(wù)器臺(tái)達(dá)風(fēng)扇需求也爆增。
近日,有消息稱國(guó)產(chǎn)服務(wù)器廠商新華三已經(jīng)向客戶發(fā)出通知,因?yàn)槭袌?chǎng)需求旺盛,再加上國(guó)際供應(yīng)鏈面臨重大的不確定性,英偉達(dá)對(duì)華特供版AI GPU H20供不應(yīng)求,公司目前庫(kù)存已經(jīng)基本耗盡。據(jù)此向新華三求證,新華三回應(yīng)稱,經(jīng)調(diào)查確認(rèn)公司及各部門均未發(fā)布此內(nèi)容。
從一位與新華三有合作的GPU模組渠道商處了解到,今年開(kāi)年因?yàn)镈eepSeek帶動(dòng)了國(guó)內(nèi)算力需求短期內(nèi)飆升,騰訊、阿里在內(nèi)的幾家頭部互聯(lián)網(wǎng)大廠客戶年后追加了H20服務(wù)器的大單,將市場(chǎng)需求直接“拉爆了”。
H20 GPU是英偉達(dá)為符合美國(guó)出口法規(guī)推出的中國(guó)市場(chǎng)專用型號(hào),采用了與被禁售的H100 GPU相同的Hopper架構(gòu),性能只有前者的六分之一(以業(yè)內(nèi)通用的FP16算力比較,H100算力達(dá)到989 Tflops,H20為148Tflops),目前是國(guó)內(nèi)公開(kāi)市場(chǎng)能夠買到的唯一英偉達(dá)合規(guī)產(chǎn)品。
英偉達(dá)通常不直接向客戶銷售H20 GPU芯片產(chǎn)品,而是通過(guò)其全球供應(yīng)鏈和分銷網(wǎng)絡(luò),將GPU模組提供給中國(guó)的服務(wù)器OEM廠商。這些廠商負(fù)責(zé)將H20 GPU與CPU、存儲(chǔ)、網(wǎng)卡集成自家的服務(wù)器上,設(shè)計(jì)并生產(chǎn)符合本地市場(chǎng)需求AI服務(wù)器(一臺(tái)服務(wù)器配置8張H20GPU)。浪潮、新華三、超聚變目前是市場(chǎng)上H20 AI服務(wù)器的主要供應(yīng)商。
據(jù)路透社報(bào)道,新華三在通知中表示,將按照利潤(rùn)優(yōu)先的原則分配收到的H20芯片,優(yōu)先考慮訂單利潤(rùn)率更高的穩(wěn)定的長(zhǎng)期客戶。
了解到,今年年初因?yàn)镈eepSeek出現(xiàn),許多地方政府、國(guó)央企以及金融、汽車等行業(yè)公司都希望盡快本地部署DeepSeek模型。本地部署需要先買進(jìn)服務(wù)器,搭建硬件基礎(chǔ)設(shè)施,大多中小企業(yè)客戶部署DeepSeek通常在單機(jī)、雙機(jī)(分別對(duì)應(yīng)一臺(tái)、兩臺(tái)服務(wù)器)上運(yùn)行,這部分屬于長(zhǎng)尾市場(chǎng)需求。
而另外一部分更大的需求來(lái)自騰訊、阿里等互聯(lián)網(wǎng)大廠。前述渠道商告訴記者,因?yàn)镠20目前是騰訊、阿里等互聯(lián)網(wǎng)大廠在公開(kāi)市場(chǎng)唯一可買到的英偉達(dá)產(chǎn)品,這些客戶年后追加的大都是數(shù)千臺(tái)服務(wù)器規(guī)模的急單,導(dǎo)致英偉達(dá)官方貨源供應(yīng)緊張,新華三等服務(wù)器廠需要優(yōu)先保障這批大客戶的訂單。
今年2月以來(lái),H20的價(jià)格也因市場(chǎng)供不應(yīng)求而快速上漲。記者從三家不同的渠道商處得知,一臺(tái)141GB顯存的H20服務(wù)器價(jià)格年初在100萬(wàn)上下,目前已經(jīng)漲到了130多萬(wàn),并且當(dāng)前價(jià)格還在持續(xù)上漲,幾乎“兩天一個(gè)價(jià)格”。
目前AI服務(wù)器市場(chǎng)的火爆也帶動(dòng)了部分國(guó)產(chǎn)芯片廠商的需求上漲,華為昇騰、寒武紀(jì)、天數(shù)智芯、沐曦、燧原、摩爾線程、壁仞都推出了針對(duì)DeepSeek部署的一體機(jī)服務(wù)器。此前據(jù)聯(lián)想官方介紹,公司與沐曦DeepSeek一體機(jī)上市首月發(fā)貨量突破千臺(tái),配近萬(wàn)張沐曦國(guó)產(chǎn)GPU。
據(jù)界面新聞了解,目前市場(chǎng)上主流國(guó)產(chǎn)AI芯片的旗艦產(chǎn)品性能上主要對(duì)標(biāo)英偉達(dá)A100GPU,目標(biāo)是“達(dá)到80%甚至100%的A100”(A100的官方算力性能是312TFLOPS,為H100的三分之一)。照此標(biāo)準(zhǔn)衡量,多數(shù)廠商的國(guó)產(chǎn)GPU單卡算力性能已經(jīng)超過(guò)H20。
但據(jù)多位渠道商介紹,雖然H20為滿足合規(guī)要求性能大幅削減,但因?yàn)橹С钟ミ_(dá)CUDA軟件生態(tài)系統(tǒng)與NVLink多卡互聯(lián)高速網(wǎng)絡(luò),與國(guó)產(chǎn)芯片相比,在實(shí)際部署大規(guī)模算力集群時(shí)兼容性更好、表現(xiàn)更佳,因此在市場(chǎng)上受更多客戶的追捧。
英國(guó)媒體《金融時(shí)報(bào)》去年7月的一篇報(bào)道估算,英偉達(dá)2024年中國(guó)市場(chǎng)銷售的H20 GPU累計(jì)超過(guò)100萬(wàn)張,總收入預(yù)估達(dá)到120億美元。隨著DeepSeek出現(xiàn)后的市場(chǎng)行情火爆,預(yù)計(jì)今年將有進(jìn)一步的提升。