中新網(wǎng)8月17日電 題:AIGC加速商業(yè)化落地,如何應對算力需求激增?
(資料圖片)
中新財經記者 夏賓
以大模型為代表的AIGC熱潮帶來了AI算力需求的爆發(fā)式增長,AI算力已成推動人工智能發(fā)展的關鍵要素。
“今年,在全球范圍都掀起了一場AI范式轉化革命,在政策和資本雙重驅動下,AIGC在加速商業(yè)化落地,超千億參數(shù)的AIGC大模型在不斷涌現(xiàn)?,F(xiàn)在中國已經發(fā)布了AIGC的模型數(shù)量超過了110個,引發(fā)了巨量化的人工智能的算力需求?!崩顺毙畔⒎掌鳟a品線總經理趙帥近日在參加2023年開放計算中國社區(qū)技術峰會(OCP China Day2023)時如是說。
計算力就是生產力,智算力就是創(chuàng)新力,更豐富的算力資源成為人工智能競爭的核心基石。IDC預計,全球AI計算市場規(guī)模將從2022年的195億美元增長到2026年的346.6億美元,其中生成式AI計算市場規(guī)模將從2022年的8.2億美元增長到2026年的109.9億美元。生成式AI計算占整體AI計算市場的比例將從4.2%增長到31.7%。
解決算力需求激增是當前市場面臨的共同挑戰(zhàn)。趙帥指出,隨著市場對于AI計算力的攀升,全球有上百家公司在投入新型的AI硬件方面的研發(fā)和設計,由于各廠商技術路線不同,多個方面都在兼容性上存在問題,導致整個AI的計算基礎設施在建設當中不得不面臨著硬件分裂化和生態(tài)離散化的重大挑戰(zhàn)。
“由于專有的硬件系統(tǒng)的挑戰(zhàn)和設計復雜性,把他們集成到一套整機系統(tǒng)中,我們所需要花費的時間和費用也更多,嚴重阻礙了AI加速器的創(chuàng)新應用和開發(fā)推廣?!壁w帥直言,大模型訓練對于算力平臺有較高要求,我們需要計算系統(tǒng)具備更高的計算性能,更快的卡間互連帶寬,以及更強的橫向拓展能力。
趙帥對中新財經記者說,為了更好去支撐大模型訓練,必須要實現(xiàn)多機互聯(lián)的集群架構,在這個擴展過程中,系統(tǒng)間的通信以及整體的散熱、接口、測試等各種各樣的標準都必須更加細化。
他進一步稱,開放加速系統(tǒng)架構憑借其散熱、供電、互聯(lián)、擴展性等設計特點,本身在設計之初可支持更高功耗、更大互聯(lián)帶寬、更強擴展能力的AI加速卡,通過支持跨節(jié)點的高速直連和橫向擴展,可以很快地實現(xiàn)萬卡級以上的集群規(guī)模,天然就適用于超大規(guī)模神經網(wǎng)絡的并行訓練。
同時,開放加速計算社區(qū)提供了統(tǒng)一的主機接口、供電方式、散熱方式、管理接口、卡間的互聯(lián)拓撲等規(guī)范,無需做任何硬件修改,就可以讓上百家AI創(chuàng)新企業(yè),更好更快地把其AI算力的相關硬件融合到AI計算服務器中去,以系統(tǒng)化方式呈現(xiàn)更好的算力,顯著降低開發(fā)投入。
此外,值得注意的是,數(shù)據(jù)中心可持續(xù)發(fā)展的技術方案正得到越來越多OCP社區(qū)成員與用戶的重視,可持續(xù)發(fā)展已成為一種社區(qū)共識。趙帥也認為,促進數(shù)據(jù)中心可持續(xù)發(fā)展已經成為必須采取的行動,從開發(fā)環(huán)保產品,到使用清潔能源改善能源結構,到應用液冷技術降低碳排,乃至電子垃圾回收及再利用,可持續(xù)發(fā)展的理念應貫徹數(shù)據(jù)中心生命周期的始終。(完)
標簽: