必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會展特約記者

“買顯存送核心”,AI芯片競賽進(jìn)入“內(nèi)存為王”!智能體大時代,中國AI芯片有何機(jī)會?

2026年3月5日 13:16每日經(jīng)濟(jì)新聞

每經(jīng)記者|朱成祥每經(jīng)編輯|杜宇

曾經(jīng),云服務(wù)廠商買AI芯片,關(guān)注GPU(圖形處理器)算力大小,而如今,可能更多的是看重顯存大小,比如是40GB還是80GB。

甚至有人調(diào)侃“買顯存送核心”,即買一張GPU算力卡,更看重的是顯存帶寬和容量,而不是GPU算力大小。

如今,內(nèi)存芯片一兩個月價格翻倍的大漲潮,正是對AI芯片進(jìn)入“內(nèi)存為王”的集中體現(xiàn)。

AI云基礎(chǔ)設(shè)施廠商PPIO相關(guān)專家告訴每經(jīng)記者:“HBM(高帶寬內(nèi)存)及CoWoS(基板上晶圓、芯片)封裝產(chǎn)生的成本已經(jīng)超過純GPU芯片,HBM成本已經(jīng)‘碾壓’核心,‘買顯存送核心’已成為現(xiàn)實!

某GPU芯片企業(yè)技術(shù)負(fù)責(zé)人李明(化名)對每經(jīng)記者表示:“結(jié)合我們硬件設(shè)計與供應(yīng)鏈經(jīng)驗,CoWoS封裝GPU中,當(dāng)前HBM顯存成本已接近甚至超過GPU核心,是整卡成本最高的單一組件!

懂芯創(chuàng)始人張慧娟告訴每經(jīng)記者:“AI芯片的競爭已從單純的算力競賽,轉(zhuǎn)向了內(nèi)存帶寬和內(nèi)存容量的雙重競賽。HBM通過先進(jìn)封裝技術(shù)與GPU裸片集成在同一封裝內(nèi),實現(xiàn)了計算與存儲的緊耦合,極大地緩解了內(nèi)存難題,越來越成為業(yè)界追捧的主要方向!

圖片來源:每經(jīng)媒資庫

2025年下半年以來,存儲芯片持續(xù)漲價成了半導(dǎo)體行業(yè)最熱門的話題。進(jìn)入2026年,存儲芯片仍保持上漲趨勢,且漲幅驚人。

而這背后,是AI芯片已進(jìn)入“內(nèi)存為王”的時代。

2023年,ChatGPT石破天驚,人類社會進(jìn)入大模型時代。進(jìn)入2026年,大模型已然從思考轉(zhuǎn)向應(yīng)用,智能體、Skill以及“養(yǎng)蝦”成了熱門話題。

人工智能的發(fā)展,也對AI芯片有了新的要求。隨著大模型參數(shù)的增加,訓(xùn)練和推理對顯存(內(nèi)存的一種)的需求也與日俱增。

張慧娟表示:“我們已經(jīng)見證了模型參數(shù)量的指數(shù)級增長,從GPT-3的1750億到萬億級MoE(混合專家模型),直接推動了HBM需求的爆發(fā)。這也逐步造成,制約算力的瓶頸往往不是芯片算力本身,而是數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)接嬎愫诵牡乃俣,因為參?shù)必須被加載到計算單元附近的高速存儲介質(zhì)中,計算單元才能以極低的延遲調(diào)用它們進(jìn)行運(yùn)算!

李明認(rèn)為:“大模型的參數(shù)量與內(nèi)存需求之間存在著直接的正向關(guān)系。在2026年的技術(shù)背景下,雖然模型架構(gòu)(如MoE混合專家模型)和量化技術(shù)(Quantization)在不斷優(yōu)化,但‘參數(shù)量越大,內(nèi)存需求越高’依然是AI領(lǐng)域的基本物理定律。除了模型權(quán)重需要的靜態(tài)顯存占用以外,大模型運(yùn)行時需要的KV Cache和激活值等都會額外占用顯存。在訓(xùn)練任務(wù)中,還需要額外顯存來保存梯度和優(yōu)化器狀態(tài)等信息!

但大模型對內(nèi)存的強(qiáng)勁“渴望”,不僅僅局限于參數(shù)的增長。

智能體的快速發(fā)展,令A(yù)I推理對AI芯片的需求大增。業(yè)界普遍認(rèn)為,未來AI推理對AI芯片的需求將大幅超越AI訓(xùn)練。

PPIO專家表示:“大模型推理場景中,GPU內(nèi)存主要用于兩個方面,一是保存大模型的權(quán)重,另一個是推理過程中用于存儲中間狀態(tài),也就是KV Cache緩存。前者由大模型參數(shù)量決定,后者取決于會話的上下文長度。大模型發(fā)展至今,參數(shù)量已經(jīng)趨于穩(wěn)定,不會大幅增加。而會話的上下文長度還在持續(xù)增加,特別是Agent(智能體)場景下,1百萬Token的上下文長度已成為主流。這樣進(jìn)一步增加對內(nèi)存的開銷,長上下文成為內(nèi)存需求的主要因素!

參數(shù)、長上下文,這兩大因素的作用下,內(nèi)存的重要性已然超越GPU計算核心。

不僅僅客戶需求側(cè)更加看重內(nèi)存。在成本結(jié)構(gòu)中,內(nèi)存的成本也大幅高于純粹的GPU核心。

PPIO專家稱:“一張GPU的成本構(gòu)成主要分成三部分,一是HBM內(nèi)存,容量越大成本越高;二是GPU核心(邏輯計算芯片);三是先進(jìn)封裝工藝(CoWoS)。高端GPU,由于HBM內(nèi)存容量更大,其HBM的成本更高,以B200(英偉達(dá)GPU)為例,其總生產(chǎn)成本的構(gòu)成中,HBM內(nèi)存占比約45%,CoWoS封裝及良率損失占比約34%,GPU核心芯片占比只有14%左右。”

即英偉達(dá)B200的成本結(jié)構(gòu)中,45%源自向SK海力士、三星、美光等廠商購買HBM,14%源自臺積電代工的GPU裸芯,34%源自臺積電代工的CoWoS封裝及良率損失。

而HBM由多層DRAM(動態(tài)隨機(jī)存取存儲器)堆疊而成。HBM需求大增,意味著SK海力士這類廠商將越來越多的DRAM產(chǎn)能用于制造HBM,相應(yīng)用于消費(fèi)級的DRAM產(chǎn)能便少了。

PPIO專家表示:“三大存儲巨頭(三星、SK海力士、美光)已經(jīng)將70%的產(chǎn)能轉(zhuǎn)移到HBM上,用于消費(fèi)電子的GDDR產(chǎn)能反而會下降。因此我們首先看到消費(fèi)領(lǐng)域的GeForce GPU的價格普遍上漲,大內(nèi)存GPU減產(chǎn)甚至停產(chǎn),這是由于GDDR內(nèi)存減產(chǎn)以優(yōu)先保障HBM內(nèi)存導(dǎo)致的!

那么,若未來存儲行業(yè)產(chǎn)能提升,消費(fèi)電子領(lǐng)域存儲價格是否也將率先受到?jīng)_擊?

張慧娟認(rèn)為:“消費(fèi)電子往往是最先感知到波動的領(lǐng)域。特別是對于存儲來說,比如手機(jī)、PC(個人電腦)用的LPDDR(低功耗內(nèi)存)、SSD(固態(tài)硬盤)等接近于標(biāo)準(zhǔn)品,價格彈性大。一旦上游晶圓產(chǎn)能提升,最先反映在現(xiàn)貨價上的是這些產(chǎn)品!

李明認(rèn)為:“未來存儲產(chǎn)能提升后,最先受到影響的是消費(fèi)電子用存儲。消費(fèi)級存儲認(rèn)證周期短、需求彈性大、替換靈活,新產(chǎn)能可快速導(dǎo)入消費(fèi)端,價格波動也最為明顯。而數(shù)據(jù)中心用存儲認(rèn)證流程通常需要6—18個月,新產(chǎn)能導(dǎo)入速度較慢,且存儲廠商會優(yōu)先保障數(shù)據(jù)中心的產(chǎn)能供給,因此它受產(chǎn)能提升的影響最晚、幅度最小?傮w而言,產(chǎn)能提升的影響會先平抑消費(fèi)端價格,再逐步傳導(dǎo)至企業(yè)級市場!

簡而言之,存儲產(chǎn)能提升后,將率先平抑消費(fèi)端存儲芯片價格。

值得一提的是,三星、SK海力士未來將有兩座晶圓廠陸續(xù)投產(chǎn),這將緩解內(nèi)存“缺貨漲價”嗎?若P4L(三星電子)和M15x(SK海力士)提前投入運(yùn)營,是否將對存儲芯片價格帶來沖擊?

張慧娟認(rèn)為:“P4L和M15x新增產(chǎn)能,很大程度上是為HBM和高性能DDR5(第五代計算機(jī)內(nèi)存規(guī)格)準(zhǔn)備的,而不是傳統(tǒng)的DDR4(第四代計算機(jī)內(nèi)存規(guī)格)或NAND(閃存)。這些屬于高端產(chǎn)能!

其補(bǔ)充表示:“對HBM的價格沖擊可能不大,甚至不會降價。因為AI芯片開發(fā)周期長,且市場處于供不應(yīng)求的局面。新增產(chǎn)能是為了填平供需缺口,有望抑制價格進(jìn)一步大漲,但難以帶來大幅降價。對普通DRAM而言,假設(shè)HBM需求不及預(yù)期,或者廠商將部分產(chǎn)線切換回通用DRAM,那么會對消費(fèi)電子內(nèi)存價格帶來壓力。但目前看,晶圓廠更傾向于優(yōu)先保證高利潤的HBM生產(chǎn)!

李明對每經(jīng)記者表示:“從存儲芯片供應(yīng)鏈與GPU硬件配套的角度分析,三星P4L與SK海力士M15x即便提前投產(chǎn),短期內(nèi)對存儲芯片價格的沖擊也較為有限。核心原因在于,這兩座工廠的新產(chǎn)能主要聚焦于HBM、先進(jìn)制程DDR等高端存儲產(chǎn)品,并未直接擴(kuò)產(chǎn)消費(fèi)級存儲!

李明補(bǔ)充表示:“當(dāng)前AI需求呈爆發(fā)式增長,高端存儲仍處于供需緊張狀態(tài),因此短期價格將維持高位。中長期來看,隨著產(chǎn)能逐步釋放,高端存儲的供給壓力會有所緩解,但新產(chǎn)能將優(yōu)先配套AI與數(shù)據(jù)中心需求,普通消費(fèi)級存儲不會出現(xiàn)大幅降價,整體呈現(xiàn)結(jié)構(gòu)性緩和態(tài)勢。此外,各大廠商的存儲優(yōu)化技術(shù),也能進(jìn)一步平衡供需,避免全品類存儲價格出現(xiàn)大幅波動!

PPIO認(rèn)為:“HBM的產(chǎn)能嚴(yán)重不足以及AI數(shù)據(jù)中心對GPU的旺盛需求是造成HBM內(nèi)存成本遠(yuǎn)高于GPU核心的主要因素。市場的供需不平衡會促使更多內(nèi)存廠商擴(kuò)大生產(chǎn),尤其是增加HBM的生產(chǎn)和供給,不過短期很難改變供需失衡的現(xiàn)狀,未來HBM內(nèi)存價格還將繼續(xù)上漲,但趨勢會放緩!

在AI算力相對不稀缺而HBM短缺的背景下,中國AI芯片廠商有何機(jī)會?

據(jù)記者了解,國內(nèi)AI芯片廠商除了自身產(chǎn)品和技術(shù)解決方案,還在基礎(chǔ)軟件層面聯(lián)合各大人工智能基礎(chǔ)設(shè)施公司、大模型廠商和互聯(lián)網(wǎng)等生態(tài)伙伴一同研究例如低精度量化、專家預(yù)測加載等工程優(yōu)化技術(shù),來系統(tǒng)性地降低實際大模型部署和應(yīng)用過程中對內(nèi)存的需求。

即在工程化領(lǐng)域,中國工程師紅利或?qū)⑼癸@。

封面圖片來源:每經(jīng)媒資庫

編 輯:魏德齡
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 專題|2026世界移動通信大會

    2026年3月2日至5日,世界移動通信大會(MWC)在西班牙巴塞羅那Fira Gran Via會展中心拉開帷幕。本屆展會以“The IQ Era”(眾智啟新)為主題,向世界展示AI與通信深度融合的無限可能。..[詳細(xì)]

  • MWC26啟幕:AI+通信深度融合,重構(gòu)行業(yè)價值邏輯

    三月的巴塞羅那,科技盛宴如期而至。3月2日至5日,世界移動通信大會(MWC26)將拉開帷幕,恰逢展會落戶當(dāng)?shù)?0周年,這場全球通信行業(yè)的開春盛事,正承載著定義下一個十年科技革命和產(chǎn)業(yè)變革..[詳細(xì)]

  • 從“參與”到“主導(dǎo)”:華為開源之路越走越寬

    如今國內(nèi)使用開源軟件、貢獻(xiàn)開源社區(qū)已經(jīng)蔚然成風(fēng),不過很少有企業(yè)像華為一樣迅速從使用開源、參與開源到成為諸多大型開源項目的主要貢獻(xiàn)者。華為計算開源業(yè)務(wù)總經(jīng)理李永樂在近日接受采訪時..[詳細(xì)]

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像