必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

華為聯(lián)合三大高校發(fā)布并開源AI容器技術Flex:ai,助力破解算力資源利用難題

2025年11月25日 08:08新浪科技

11月24日晚間消息,在近日的2025 AI容器應用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰正式發(fā)布AI容器技術——Flex:ai。同時,華為聯(lián)合上海交通大學、西安交通大學與廈門大學共同宣布,將此項產(chǎn)學合作成果向外界開源,助力破解算力資源利用難題。

當前,AI產(chǎn)業(yè)高速發(fā)展催生海量算力需求,但全球算力資源利用率偏低的問題日益凸顯,“算力資源浪費”成為產(chǎn)業(yè)發(fā)展的關鍵桎梏:小模型任務獨占整卡導致資源閑置,大模型任務單機算力不足難以支撐,大量缺乏GPU/NPU的通用服務器更是處于算力“休眠”狀態(tài),供需錯配造成嚴重的資源浪費。

本次發(fā)布并開源的Flex:ai XPU池化與調(diào)度軟件,是基于Kubernetes容器編排平臺構建,通過對GPU、NPU等智能算力資源的精細化管理與智能調(diào)度,實現(xiàn)AI工作負載與算力資源的精準匹配,可大幅提升算力利用率。

據(jù)介紹,該技術深度融合了三大高校與華為的科研力量,形成三大核心技術突破:針對AI小模型訓推場景中“一張卡跑一個任務”的資源浪費問題,華為與上海交通大學聯(lián)合研發(fā)XPU池化框架,可將單張GPU或NPU算力卡切分為多份虛擬算力單元,實現(xiàn)算力單元的按需切分,使此類場景下的整體算力平均利用率提升30%;針對大量通用服務器因缺乏智能計算單元而無法服務于AI工作負載的問題,華為與廈門大學聯(lián)合研發(fā)跨節(jié)點拉遠虛擬化技術。該技術將集群內(nèi)各節(jié)點的空閑XPU算力聚合形成“共享算力池”,促進通用算力與智能算力資源融合;面對算力集群中多品牌、多規(guī)格異構算力資源難以統(tǒng)一調(diào)度的痛點,華為與西安交通大學共同打造Hi Scheduler智能調(diào)度器,實現(xiàn)AI工作負載分時復用資源。即便在負載頻繁波動的場景下,也能保障AI工作負載的平穩(wěn)運行。

編 輯:路金娣
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像