必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會展特約記者

誰在消耗5萬億模型算力?

2026年3月9日 07:0521世紀(jì)經(jīng)濟(jì)報(bào)道

2026年2月9日至2月15日,在線人工智能托管平臺OpenRouter發(fā)布了一組數(shù)據(jù):中國大模型的單周調(diào)用量達(dá)到4.12萬億Token,歷史上首次超過美國模型的2.94萬億Token。

OpenRouter是一個(gè)聚合全球大模型接口的平臺,被稱為人工智能界的“超級接口”。開發(fā)者不需要逐一去注冊大模型公司的賬號,只需通過該平臺的統(tǒng)一接口,就能自由調(diào)用全球各家公司推出的各類模型,因此,該平臺的使用量數(shù)據(jù)通常被視為全球大模型受歡迎程度和真實(shí)應(yīng)用強(qiáng)度的風(fēng)向標(biāo)。

緊接著的2月16日至2月22日這一周,中國大模型的周調(diào)用量進(jìn)一步?jīng)_高至5.16萬億Token,三周內(nèi)增長了127%,在當(dāng)周全球大模型周調(diào)用量排名前五的榜單中,MiniMax M2.5、月之暗面Kimi K2.5、智譜GLM-5與深度求索DeepSeek V3.2占據(jù)了四個(gè)席位。

根據(jù)官方用戶數(shù)據(jù),在OpenRouter平臺近47.17%的用戶來自美國、中國開發(fā)者僅占6.01%的背景下,這組數(shù)據(jù)反映出海外開發(fā)者對中國模型的使用意愿正在快速上升。

Token是人工智能處理語言的基本單元。在算力市場中,Token調(diào)用量是衡量大模型使用強(qiáng)度、商業(yè)價(jià)值與滲透深度的核心指標(biāo),海外開發(fā)者對中國模型的高頻調(diào)用,標(biāo)志著人工智能產(chǎn)業(yè)的重心正在發(fā)生轉(zhuǎn)移,行業(yè)不再單純比拼構(gòu)建大模型時(shí)的“一次性訓(xùn)練成本”,而是進(jìn)入了高頻度、常態(tài)化的“應(yīng)用推理”階段。

應(yīng)用重心的遷移直接導(dǎo)致了下游采購標(biāo)準(zhǔn)的轉(zhuǎn)向,國產(chǎn)AI芯片廠商也由此獲得了加快進(jìn)入市場的機(jī)會。

五萬億Token流向了哪里

要厘清這五萬億Token的去向,首先需要觀察用戶使用人工智能的方式發(fā)生了什么變化。

根據(jù)OpenRouter與風(fēng)險(xiǎn)投資機(jī)構(gòu)a16z聯(lián)合發(fā)布的《2025 AI使用報(bào)告》,該平臺處理的編程任務(wù)Token占比已從2025年初的11%增加到了50%以上,成為最大的單一使用品類。這一轉(zhuǎn)變背后,是人工智能應(yīng)用模式從“問答式”向“智能體(Agent)”模式的切換。

在早期的問答模式下,用戶提一個(gè)問題,模型給出一個(gè)回答,單次交互消耗的Token通常在幾百到幾千個(gè)之間。一旦用戶停止提問,消耗也就隨之停止。但進(jìn)入智能體模式后,人工智能開始在后臺持續(xù)執(zhí)行多步驟任務(wù)。

上海一家算力芯片廠商的負(fù)責(zé)人告訴記者,以編程場景為例,一個(gè)智能體在接收到指令后,會經(jīng)歷編寫代碼、運(yùn)行測試、識別報(bào)錯(cuò)、自我修正、再次運(yùn)行的循環(huán),為了讓機(jī)器記住此前的操作,每次調(diào)用都需要攜帶完整的對話歷史。

比如,目前國產(chǎn)大模型諸如智譜GLM-5等新一代模型已經(jīng)支持200K(約20萬Token)的超長上下文窗口。這種多輪自我修正和工具鏈級聯(lián)的模式,使得單次活躍會話的Token吞吐量呈幾何級數(shù)增長。

另外,多模態(tài)應(yīng)用的落地則進(jìn)一步推高了消耗量。根據(jù)公開數(shù)據(jù),年初爆火的Seedance 2.0視頻模型生成一條10秒、1080p規(guī)格的視頻,大約需要消耗35萬Token。

視頻生成場景單位時(shí)間內(nèi)產(chǎn)生的Token消耗,是傳統(tǒng)文本問答的數(shù)百倍。

“當(dāng)前數(shù)萬億Token級別的調(diào)用量,已不再主要由測試性場景構(gòu)成,而是由一批高頻、規(guī)模化、可持續(xù)付費(fèi)的商業(yè)應(yīng)用所支撐!备ト羲固厣忱模‵rost & Sullivan)中國業(yè)務(wù)主管合伙人兼董事總經(jīng)理陸景向經(jīng)濟(jì)觀察報(bào)記者表示。

陸景介紹,從頭豹研究院對國內(nèi)大模型商業(yè)生態(tài)的調(diào)研來看,目前集中買單的領(lǐng)域主要包括互聯(lián)網(wǎng)、金融、跨境電商與娛樂行業(yè)。

具體場景則涵蓋了以下三類:第一類是企業(yè)級應(yīng)用,如智能客服、智能營銷、代碼輔助開發(fā)、辦公自動化工具等,這類應(yīng)用在金融、電商、游戲行業(yè)已實(shí)現(xiàn)規(guī);渴穑坏诙愂腔ヂ(lián)網(wǎng)平臺中的生成式內(nèi)容服務(wù),包括智能搜索、對話式助手與虛擬角色;第三類是AIGC(人工智能生成內(nèi)容)生產(chǎn)工具,如短視頻腳本生成、廣告文案創(chuàng)作、跨境電商商品描述生成等。

這些行業(yè)的共同特征是,業(yè)務(wù)流程中存在高比例的文本或多模態(tài)內(nèi)容生成需求,且企業(yè)能夠承接大模型服務(wù)產(chǎn)生的算力成本。

2026年2月10日,在鄭州舉行的“國產(chǎn)萬卡算力賦能大模型發(fā)展研討會”上,中國科學(xué)院自動化所研究員陳盈盈表示,驅(qū)動行業(yè)發(fā)展的核心動力依然是大算力、大數(shù)據(jù)與大參數(shù)。但隨著模型參數(shù)量增長帶來的性能提升進(jìn)入瓶頸期,行業(yè)正邁向智能體、合成數(shù)據(jù)和推理計(jì)算,數(shù)據(jù)決定了人工智能的高度,環(huán)境將決定模型演進(jìn)的方向。

應(yīng)用模式的改變,解釋了調(diào)用量為何飆升,那為何國產(chǎn)大模型又能在新的范式下,承接住來自全球高頻的調(diào)用需求呢?

前述算力芯片廠商負(fù)責(zé)人告訴記者,目前,MiniMax M2.5、Kimi K2.5等國產(chǎn)模型普遍采用了“混合專家(MoE)”架構(gòu)。與傳統(tǒng)的稠密模型(Dense Model)在每次運(yùn)算時(shí)都要激活全部參數(shù)不同,MoE架構(gòu)通過按需激活特定的專家網(wǎng)絡(luò),使推理時(shí)的顯存占用降低了約60%,吞吐量得到顯著提升。

稠密模型的設(shè)計(jì)邏輯是,處理每一個(gè)輸入請求時(shí),神經(jīng)網(wǎng)絡(luò)中的每一個(gè)參數(shù)都必須參與計(jì)算。這意味著隨著模型規(guī)模的增大,所需的算力與顯存開銷會同步呈線性增長。

混合專家架構(gòu)則改變了這種全量運(yùn)算的模式,它將模型參數(shù)劃分為多個(gè)功能組,即“專家”,在執(zhí)行具體任務(wù)時(shí),路由系統(tǒng)會識別需求并只激活與之相關(guān)的部分參數(shù)。這種分工機(jī)制使得模型可以在保持巨大參數(shù)量的同時(shí),大幅降低單次推理所需的有效算力。

技術(shù)上的優(yōu)化直接反映在了售價(jià)上。目前中國模型的輸入價(jià)格約為0.3美元/百萬Token,而部分海外同類產(chǎn)品的價(jià)格在5美元左右。此外,電力成本也是一個(gè)變量,中國西部算力節(jié)點(diǎn)的電力成本約為每度0.2元至0.3元,而歐美地區(qū)的成本在1元至1.5元之間。

這種成本優(yōu)勢促成了供需關(guān)系的再平衡。2026年春節(jié)期間,國產(chǎn)大模型迎來密集發(fā)布潮。2月11日,智譜上線底座模型GLM-5;2月12日,MiniMax開源文本模型M2.5;2月14日,字節(jié)跳動發(fā)布豆包大模型2.0系列,與此同時(shí),大廠圍繞AI應(yīng)用的紅包戰(zhàn)同步打響:百度投入5億元,騰訊元寶10億元,阿里推出30億元免單計(jì)劃。

密集的應(yīng)用落地也拉動了算力消耗的急劇攀升。公開數(shù)據(jù)顯示,中國日均Token消耗從2024年初的1000億攀升至2026年2月的180萬億級別,在這種爆發(fā)式的需求驅(qū)動下,此前深陷價(jià)格戰(zhàn)的國內(nèi)大模型廠商開始集體調(diào)頭。

比如,2026年2月12日,智譜AI在發(fā)布新模型的同時(shí),宣布上調(diào)其API(應(yīng)用程序編程接口)調(diào)用價(jià)格,部分海外訂閱價(jià)格漲幅達(dá)到30%至60%,API調(diào)用價(jià)格漲幅最高達(dá)到100%。智譜對此回應(yīng)稱,用戶規(guī)模與調(diào)用量快速提升,公司需同步加大算力投入。另外,月之暗面旗下的Kimi K2.5發(fā)布不到一個(gè)月,其海外收入便超過了國內(nèi)收入。

也就是說,大模型公司正在告別虧本引流的價(jià)格戰(zhàn),開始有了實(shí)打?qū)嵉臉I(yè)務(wù)收入。五萬億Token的流向表明,人工智能正在從單純的對話框,轉(zhuǎn)變?yōu)榻鹑、電商與編程場景中在后臺自動運(yùn)轉(zhuǎn)的工業(yè)流程。

而順著這股成倍增長的數(shù)據(jù)流往上游看,那些承載運(yùn)算任務(wù)的智算中心,挑選算力硬件的眼光也發(fā)生了變化。

算力采購的標(biāo)準(zhǔn)變了

算力市場的核心指標(biāo)正在從搶奪計(jì)算卡轉(zhuǎn)向核算單位產(chǎn)出成本。

2025年,中國GPU算力租賃市場經(jīng)歷了價(jià)格下調(diào)。比如,英偉達(dá)H100計(jì)算卡的租賃價(jià)格從高峰時(shí)的每小時(shí)90多元人民幣,跌至15元到20元;A100的價(jià)格則降至每小時(shí)3元到5元。

這種價(jià)格走勢背后是采購邏輯的更替。在大模型開發(fā)初期,由于高性能芯片稀缺,市場處于資源囤積階段,追求的是單卡的算力峰值(FLOPS)。但當(dāng)推理負(fù)載成為常態(tài)后,企業(yè)開始核算總擁有成本(TCO)。

“客戶不再只盯著單卡的絕對算力峰值,而是開始計(jì)算每投入一元錢能換取多少吞吐量,每消耗一瓦電能處理多少Token。”前述算力芯片廠商負(fù)責(zé)人向經(jīng)濟(jì)觀察報(bào)記者表示。

該負(fù)責(zé)人認(rèn)為,當(dāng)前的算力需求呈現(xiàn)出推理與渲染的雙重特征。除了文本生成,AI智能體云底座、云手機(jī)、數(shù)字孿生及工業(yè)仿真等場景對實(shí)時(shí)交互的需求,正在拉動對全功能GPU的采購。進(jìn)入推理階段之后,國產(chǎn)芯片迎來了切入窗口——訓(xùn)練階段行業(yè)高度依賴英偉達(dá)的CUDA生態(tài),而推理任務(wù)則更聚焦于能耗、穩(wěn)定性和供應(yīng)安全。

TrendForce集邦咨詢分析師龔明德在回復(fù)經(jīng)濟(jì)觀察報(bào)記者采訪時(shí)亦預(yù)計(jì),2026年推理型AI服務(wù)器在整體出貨結(jié)構(gòu)中的比重有望提升至44%,相較于2025年上升3個(gè)百分點(diǎn)。

龔明德認(rèn)為,相比追求算力密度的大模型訓(xùn)練集群,推理型服務(wù)器在底層硬件架構(gòu)設(shè)計(jì)上更注重性價(jià)比和能效比,推理端對高端封裝(如CoWoS)和高帶寬內(nèi)存(HBM)的嚴(yán)苛要求有所下調(diào)。

在龔明德看來,這種規(guī)格的放寬,有利于中國本土企業(yè)在取得HBM受限的情況下,發(fā)展中等規(guī)模算力的推理芯片,并在互聯(lián)網(wǎng)、車載系統(tǒng)等領(lǐng)域提供機(jī)會。

隨著行業(yè)重心轉(zhuǎn)向推理和微調(diào),企業(yè)客戶在規(guī)劃智算中心預(yù)算時(shí),投入結(jié)構(gòu)也發(fā)生了改變。

對此,陸景分析稱,過去在訓(xùn)練階段,投入主要集中在高端訓(xùn)練型GPU集群、超高速互聯(lián)網(wǎng)絡(luò)以及高性能存儲系統(tǒng),以滿足長時(shí)間、高并行度的訓(xùn)練需求。而在推理需求增長的背景下,企業(yè)開始更多采用推理優(yōu)化型GPU、國產(chǎn)AI芯片或異構(gòu)算力組合。在投入結(jié)構(gòu)中,軟件平臺、算力調(diào)度、模型優(yōu)化工具以及推理加速框架的占比逐步提升。

陸景認(rèn)為,國內(nèi)人工智能芯片在底層軟件生態(tài)建設(shè)方面,正處于由可用向規(guī);逃眠^渡的階段,主要國產(chǎn)芯片廠商已構(gòu)建起包括驅(qū)動層、編譯器、算子庫、運(yùn)行時(shí)環(huán)境在內(nèi)的基礎(chǔ)工具鏈體系,能夠支持大模型訓(xùn)練、推理及智算中心部署。

目前的算力采購也已經(jīng)從單卡送測進(jìn)入了系統(tǒng)級工程交付階段。由于推理任務(wù)對響應(yīng)延遲極其敏感,萬卡規(guī)模的集群在協(xié)同工作中,網(wǎng)絡(luò)通信和散熱能力往往比單張計(jì)算卡的“跑分”更具決定性。

2026年2月5日,國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)正式上線試運(yùn)行。在這個(gè)節(jié)點(diǎn)上,部署了3套由中科曙光(84.190, -0.60, -0.71%)(603019.SH)提供的scaleX萬卡超集群,最大可提供超過3萬張國產(chǎn)加速卡的算力,這是全國首個(gè)實(shí)現(xiàn)3萬卡部署且實(shí)際投入運(yùn)營的國產(chǎn)AI算力池。

中科曙光高級副總裁李斌告訴經(jīng)濟(jì)觀察報(bào)記者,鄭州核心節(jié)點(diǎn)的上線,驗(yàn)證了國產(chǎn)算力基礎(chǔ)設(shè)施的工程化能力,行業(yè)已從早期的單點(diǎn)突破,轉(zhuǎn)向大規(guī)模落地部署。此前各家廠商在硬件設(shè)計(jì)、軟件棧和互連協(xié)議上自成體系,導(dǎo)致算力資源難以跨平臺調(diào)度。

“萬卡集群的落地不僅是IT技術(shù)問題,更是冷卻、供電等跨學(xué)科的工程化挑戰(zhàn)!崩畋髲(qiáng)調(diào),如果單點(diǎn)技術(shù)出現(xiàn)短板,會直接拖累整個(gè)系統(tǒng)的效率,目前的系統(tǒng)研制突破了傳統(tǒng)IT技術(shù)與其他工程技術(shù)的結(jié)合瓶頸。

目前,該國產(chǎn)算力系統(tǒng)已完成了千款應(yīng)用的適配。根據(jù)國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)運(yùn)維主任安磊的介紹,超算互聯(lián)網(wǎng)第一期已有645家第三方商家適配了該節(jié)點(diǎn),超過7200款軟件和源碼接入。

在這些資源的支持下,已有超過70%的國產(chǎn)新能源汽車在該平臺上進(jìn)行流體和碰撞仿真實(shí)驗(yàn),例如,針對國家新出臺的規(guī)范可能要求禁用新能源車隱藏把手的變化,車企需要利用大集群模擬門把手改為開放式后對能效與風(fēng)阻的影響。

此外,該集群還支撐了國產(chǎn)羽絨服頂級面料的研發(fā),以及為國際奢侈品品牌提供智算資源支持其在國內(nèi)的優(yōu)化設(shè)計(jì)。

這種由下游應(yīng)用爆發(fā)倒逼上游基建升級的邏輯,也正在轉(zhuǎn)化為國產(chǎn)芯片廠商的業(yè)務(wù)收入。比如,根據(jù)2026年初中國移動(95.610, 0.00, 0.00%)的人工智能通用計(jì)算設(shè)備集采結(jié)果,在總價(jià)值超過50億元的訂單中,采購?fù)评硇虯I服務(wù)器7499臺。其中,華為昇騰系廠商斬獲了34億元的份額,昆侖技術(shù)等國產(chǎn)企業(yè)的占比顯著提升。

另外,國產(chǎn)算力廠商的業(yè)績也在過去一年實(shí)現(xiàn)了爆發(fā)性增長。比如,2月27日,寒武紀(jì)發(fā)布的業(yè)績快報(bào)顯示,2025年?duì)I收增長453.21%,達(dá)到64.97億元,并實(shí)現(xiàn)了20.59億元的歸母凈利潤,這是該公司上市以來的首次年度盈利,寒武紀(jì)表示,收入增長受益于人工智能行業(yè)算力需求的攀升,公司推動了應(yīng)用場景的落地。類似地,摩爾線程、沐曦股份、海光信息2025年度的業(yè)績表現(xiàn)亦均有大幅提升。

瀚博半導(dǎo)體創(chuàng)始人兼CEO錢軍則向經(jīng)濟(jì)觀察報(bào)記者表示,物理人工智能正接近關(guān)鍵拐點(diǎn),實(shí)現(xiàn)路徑依賴于從虛擬到現(xiàn)實(shí)的閉環(huán)。瀚博半導(dǎo)體成立于2018年12月,是一家國產(chǎn)高性能GPU芯片提供商。

錢軍表示,圖形渲染作為構(gòu)筑仿真與數(shù)字孿生的基礎(chǔ),是連接人工智能與物理世界的第一步,該公司已在AI推理與云渲染領(lǐng)域建立了基本盤,目前其產(chǎn)品已在超10家頭部互聯(lián)網(wǎng)公司、多家運(yùn)營商和央國企落地。

根據(jù)伯恩斯坦(Bernstein)發(fā)布的《2025年中國AI芯片產(chǎn)業(yè)報(bào)告》,中國本土AI芯片品牌市場滲透率已從2024年的約29%提升至2025年的42%。這也意味著,在數(shù)萬億Token持續(xù)消耗的背后,國產(chǎn)算力通過對行業(yè)應(yīng)用的適配和成本結(jié)構(gòu)的優(yōu)化,正在完成從邊緣備選向市場首選的跨越。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 2026十大科技趨勢

    2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順?biāo)欤?/P>[詳細(xì)]

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像