2025-11-21 22:13:18
AI 產(chǎn)業(yè)算力需求大,但資源利用率低、浪費(fèi)嚴(yán)重。11月21日,華為在論壇發(fā)布 AI 容器技術(shù)Flex:ai,它通過(guò)算力切分,將單卡精準(zhǔn)切分為多份,提升資源利用率30%,延續(xù)“以軟件補(bǔ)硬件”路徑。該技術(shù)對(duì)標(biāo)英偉達(dá)收購(gòu)的 Run:ai,且無(wú)生態(tài)限制。其能力已在瑞金醫(yī)院多模態(tài)病理大模型中得到驗(yàn)證,還將在發(fā)布后開(kāi)源。
每經(jīng)記者|王晶 每經(jīng)編輯|文多
AI(人工智能)產(chǎn)業(yè)高速發(fā)展正催生海量算力需求,但全球算力資源利用率偏低的問(wèn)題日益凸顯,“算力資源浪費(fèi)”成為產(chǎn)業(yè)發(fā)展的關(guān)鍵桎梏。其具體表現(xiàn)為,小模型任務(wù)獨(dú)占整卡導(dǎo)致資源閑置,大模型任務(wù)單機(jī)算力不足難以支撐,大量缺乏GPU(圖形處理器)/NPU(神經(jīng)網(wǎng)絡(luò)處理器)的通用服務(wù)器甚至處于算力“休眠”狀態(tài),供需錯(cuò)配造成資源浪費(fèi)。
11月21日,在2025AI容器應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)布了AI容器技術(shù)——Flex:ai。據(jù)悉,F(xiàn)lex:ai通過(guò)算力切分技術(shù),將單張GPU/NPU算力卡切分為多份虛擬算力單元,切分粒度精準(zhǔn)至10%。此技術(shù)實(shí)現(xiàn)了單卡同時(shí)承載多個(gè)AI工作負(fù)載,在無(wú)法充分利用整卡算力的AI工作負(fù)載場(chǎng)景下,算力資源平均利用率可提升30%。
在面臨先進(jìn)制程受限、單顆AI芯片性能與國(guó)外存在差距的現(xiàn)實(shí)下,F(xiàn)lex:ai延續(xù)了華為“以軟件補(bǔ)硬件”的發(fā)展路徑。
值得一提的是,華為這項(xiàng)新技術(shù)還將對(duì)標(biāo)英偉達(dá)2024年底收購(gòu)的以色列公司Run:ai。Run:ai的核心產(chǎn)品是基于“Kubernetes”(開(kāi)源容器編排平臺(tái))構(gòu)建的軟件平臺(tái)。其可通過(guò)動(dòng)態(tài)調(diào)度、池化和分片等手段優(yōu)化GPU資源使用。例如,自動(dòng)駕駛公司W(wǎng)ayve就借助Run:ai將GPU集群效率從不足25%提升到80%以上。華為的Flex:ai同樣聚焦于通過(guò)軟件創(chuàng)新實(shí)現(xiàn)對(duì)英偉達(dá)、昇騰等其他第三方算力的統(tǒng)一管理與調(diào)度,屏蔽底層硬件差異,為AI應(yīng)用提供更高效穩(wěn)定的資源支撐。
此外,相比Run:ai主要服務(wù)于英偉達(dá)GPU生態(tài),F(xiàn)lex:ai并沒(méi)有生態(tài)限制,英偉達(dá)的GPU和華為昇騰NPU等算力卡都可以使用。
Flex:ai的能力已在真實(shí)產(chǎn)業(yè)場(chǎng)景中得到驗(yàn)證。瑞金醫(yī)院與華為聯(lián)合打造的多模態(tài)病理大模型“RuiPath”,被用于識(shí)別病理切片病灶區(qū)域,覆蓋19個(gè)常見(jiàn)癌種。該模型基于103萬(wàn)張病理切片數(shù)據(jù)訓(xùn)練而成,但僅用16張昇騰910B算力卡便可完成大規(guī)模訓(xùn)練。這背后離不開(kāi)Flex:ai的技術(shù)支撐,其通過(guò)算力資源切分、智能任務(wù)調(diào)度等技術(shù),將XPU(CPU、GPU、DPU等芯片的統(tǒng)稱(chēng))資源可用度從40%提升至70%,破解了有限算力下的大規(guī)模訓(xùn)練難題。
IT研究與咨詢(xún)公司“Gartner”的分析師表示,目前AI負(fù)載大多都已容器化部署和運(yùn)行。據(jù)預(yù)測(cè),到2027年,75%以上的AI工作負(fù)載將采用容器技術(shù)進(jìn)行部署和運(yùn)行。
華為方面稱(chēng),F(xiàn)lex:ai將在發(fā)布后同步開(kāi)源在魔擎社區(qū)中,并與華為此前開(kāi)源的多款A(yù)I工具共同組成完整的ModelEngine(華為推出的AI訓(xùn)推全流程工具鏈)開(kāi)源生態(tài)。
封面圖片來(lái)源:圖片來(lái)源:視覺(jué)中國(guó)-VCG211478193393
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP