一體化算力網(wǎng)的產(chǎn)業(yè)實(shí)踐:算網(wǎng)協(xié)同、以網(wǎng)強算

2024-06-28 05:00:00 21世紀經(jīng)濟報道 孔海麗

算力是數字經(jīng)濟時(shí)代的新型生產(chǎn)力,算力網(wǎng)則是支撐數字經(jīng)濟高質(zhì)量發(fā)展的關(guān)鍵基礎設施。在人工智能等新興技術(shù)驅動(dòng)下,產(chǎn)業(yè)各方積極探索算力匯聚,算力互聯(lián)互通。

在加快構建全國一體化算力網(wǎng)的過(guò)程中,產(chǎn)業(yè)鏈上下游分別承擔了哪些角色,涌現出什么趨勢,遇到了什么難點(diǎn)與挑戰,又該如何協(xié)同解決?

6月21日,由21世紀經(jīng)濟報道、21世紀新質(zhì)生產(chǎn)力研究院主辦的“高端智庫看‘新質(zhì)生產(chǎn)力’——一體化算力建設”閉門(mén)研討會(huì )在北京落地,研討會(huì )邀請到了中國信通院云計算與大數據研究所、中國社會(huì )科學(xué)院數量經(jīng)濟與技術(shù)經(jīng)濟研究所等多位專(zhuān)家及多位企業(yè)代表等面對面交流。

百度智能云、新華三、曙光數創(chuàng )、天風(fēng)證券分別作為云廠(chǎng)商、服務(wù)器廠(chǎng)商、數據中心基礎設施供應商、投資機構代表,分享了一體化算力網(wǎng)建設中的企業(yè)思考。

算網(wǎng)協(xié)同走到關(guān)鍵時(shí)刻

隨著(zhù)人工智能技術(shù)的快速發(fā)展,AI場(chǎng)景下的任務(wù)數量以及對智算算力的需求激增,以GPU為主要芯片的智算算力作為新型算力,亟待突破。

在這樣的背景下,算網(wǎng)協(xié)同、以網(wǎng)強算,成為重要的解題思路。

新華三路由器產(chǎn)品線(xiàn)總經(jīng)理汪小勇認為,很多時(shí)候,網(wǎng)絡(luò )成了算力建設的瓶頸,如果沒(méi)有好的網(wǎng)絡(luò )架構與協(xié)同,即便搶到了算力卡,也無(wú)法把算卡的性能有效發(fā)揮出來(lái),這就要求用高效的網(wǎng)絡(luò )連接把算力潛能釋放出來(lái)。

“在智算時(shí)代,通信量非常大,對網(wǎng)絡(luò )的時(shí)延非常敏感,對網(wǎng)絡(luò )的丟包非常敏感,建設智能無(wú)損網(wǎng)絡(luò )是一個(gè)非常重要的趨勢?!蓖粜∮抡f(shuō),多智算中心的互聯(lián)也是一個(gè)重要趨勢,通過(guò)內部網(wǎng)絡(luò )的搭建、算力智能部署,實(shí)現低時(shí)延、低抖動(dòng),并有效降低算力成本,提高算網(wǎng)效率。

百度智能云混合云生態(tài)合作總監余晨表示,今年以來(lái),在監管層及產(chǎn)業(yè)鏈上下游的共同推動(dòng)下,算網(wǎng)協(xié)同的認知有所深化。在算力一張網(wǎng)的基礎上,不同算力集群做好場(chǎng)景區分,設計出特定的算力方案,一張大網(wǎng)連接著(zhù)多張小網(wǎng),最終實(shí)現提效。

余晨認為,互聯(lián)互通的算力解決方案,應該將異構算力的標準化接口設計、存儲配比及協(xié)同化、網(wǎng)絡(luò )配比等方面,更精細化地納入到算網(wǎng)設計中,以實(shí)現更好的互聯(lián)。

曙光數創(chuàng )副總裁姚勇則從硬件端展開(kāi)分享。他認為,AI服務(wù)器散熱技術(shù)走到了關(guān)鍵分水嶺。具體而言,光模塊、AI服務(wù)器、AI芯片、交換機和液冷設備是組建AI算力的五大必備硬件,隨著(zhù)AI算力的快速發(fā)展,散熱技術(shù)也從風(fēng)冷向液冷階段進(jìn)化。

姚勇介紹,風(fēng)冷是以空氣為冷卻介質(zhì),利用風(fēng)機的強制風(fēng)冷,風(fēng)冷成本低,適合小規模數據中心;液冷是以液體為介質(zhì)進(jìn)行熱交換,例如利用水、乙二醇水溶液、空氣制冷劑等進(jìn)行散熱。液冷的散熱速度和效率更高,但結構更復雜、成本更高,適合大規模數據中心和智算中心。

目前數據中心溫控仍以風(fēng)冷為主,隨著(zhù)AI的大規模發(fā)展,帶動(dòng)算力需求提升,芯片和服務(wù)器功率逐步升級,超出風(fēng)冷散熱能力范疇。

“我們預測,三年之后,液冷和風(fēng)冷將平分天下?!币τ卤硎?,“芯片的工作溫度是八九十攝氏度,一定空間里高密度部署高功率芯片,最后決定算力水平的有可能不是半導體技術(shù),而是散熱技術(shù)?!?/p>

2023年6月,中國移動(dòng)、中國電信、中國聯(lián)通三大運營(yíng)商聯(lián)合發(fā)布了《電信運營(yíng)商液冷技術(shù)白皮書(shū)》,提出2025年50%以上數據中心項目應用液冷技術(shù)?!斑@也將有效推動(dòng)液冷行業(yè)的高速發(fā)展?!币τ抡f(shuō)。

在全國一體化算力網(wǎng)建設加快構建的背景下,產(chǎn)業(yè)鏈上下游出現了哪些新的動(dòng)向?天風(fēng)證券海外資深分析師李澤宇分享了幾個(gè)趨勢。

李澤宇表示,AI技術(shù)迭代到了關(guān)鍵時(shí)期,從商業(yè)模式上來(lái)看,大模型對算力的需求走到了更大的數據級別,對算力一體化的需求大幅度提升,這需要多算力中心高效配合調度,功率密度的提升也讓散熱技術(shù)走到了從風(fēng)冷向液冷轉變的臨界點(diǎn)。

“應用端也有很大的變化,一是智算算力對時(shí)延和計算密度的要求大幅提升,二是云邊一體的推理方式迎來(lái)巨大機遇,三是異構計算箭在弦上,解決好不同芯片之間、不同區域算力中心之間的互聯(lián),整個(gè)行業(yè)處在快速的增長(cháng)期?!崩顫捎钫f(shuō)。

產(chǎn)業(yè)鏈實(shí)踐與挑戰

在全國一體化算力網(wǎng)建設的熱潮中,不同企業(yè)主體承擔了不同的角色,在具體實(shí)踐中尋求一體化算力網(wǎng)的解決方案。

據余晨透露,百度的優(yōu)勢是掌握場(chǎng)景、數據和客戶(hù),把廣泛的客戶(hù)需求與上下游產(chǎn)業(yè)鏈結合起來(lái),提供一個(gè)更具性?xún)r(jià)比更高效的算力綜合解決方案。

在基礎架構層,涉及算力網(wǎng)絡(luò )等資源集群的管理,云廠(chǎng)商具備大型集群運營(yíng)、管理的業(yè)務(wù)沉淀;在框架層,得益于大模型在技術(shù)架構上的突破,云廠(chǎng)商得以更多地參與到全國算力一張網(wǎng)的建設中去;在應用層,云廠(chǎng)商與行業(yè)龍頭企業(yè)攜手,更好地服務(wù)于行業(yè)應用。

汪小勇則從“算力+網(wǎng)絡(luò )”的層面分析了算網(wǎng)解決方案的要點(diǎn)。據他透露,國內網(wǎng)絡(luò )的核心訴求是“無(wú)損”,即保證傳輸數據的完整性,同時(shí)也要保證傳輸速度和效率。這需要在低時(shí)延、零丟包、可靠性、負載均衡和確定性網(wǎng)絡(luò )等方面下功夫。

“新華三在大的理念上有12個(gè)字,分別是‘以網(wǎng)強算、以算提質(zhì)、以智增效’?!蓖粜∮卤硎?,網(wǎng)絡(luò )的高效運行可以充分發(fā)揮算力的性能,智算算力也可以更好地賦能網(wǎng)絡(luò ),新華三的百業(yè)靈犀大模型在算力網(wǎng)絡(luò )領(lǐng)域形成了行業(yè)知識庫,可以指導于網(wǎng)絡(luò )建設。

據姚勇分享,曙光數創(chuàng )與互聯(lián)網(wǎng)、金融、運營(yíng)商等領(lǐng)域的客戶(hù)一起,在實(shí)踐中逐步摸索智算中心部署液冷設備的標準,從既往經(jīng)驗來(lái)看,一臺算力服務(wù)器的功率達到15千瓦以上,就有必要采用液冷技術(shù)。

“以液冷技術(shù)解決高密問(wèn)題,一是因為液冷技術(shù)本身就具備的優(yōu)勢,液體帶走芯片熱量更順暢、也更高效;二是要注意從工程角度考慮到流動(dòng)性、流速、壓力等因素,液冷不是一個(gè)單純的單機設備,而是要綜合解決算力協(xié)同問(wèn)題?!币τ抡f(shuō),巨大的算力在倒逼算力設備做出形態(tài)上的變化。

汪小勇提出,一體化算力網(wǎng)絡(luò )建設還存在一些難點(diǎn)與挑戰,包括區域性與結構性布局問(wèn)題,東西算力結構性不平衡,通算、智算、超算合理布局仍需進(jìn)一步提升;二是算力有效調度挑戰,仍需要在技術(shù)端與協(xié)調機制方面繼續健全;三是網(wǎng)絡(luò )通道傳輸與資費問(wèn)題,質(zhì)量在提高,資費要進(jìn)一步降低;安全防護與標準規范建立也需加強。

與會(huì )企業(yè)代表均表示,將在算力網(wǎng)絡(luò )的基礎設施建設、關(guān)鍵技術(shù)研發(fā)、應用等方面進(jìn)一步加大投入,不斷探索,加強協(xié)同。

21財經(jīng)客戶(hù)端下載