為何要建設國家超算互聯(lián)網(wǎng)?國家超算互聯(lián)網(wǎng)如何實現(xiàn)算力資源統(tǒng)籌調(diào)度、賦能產(chǎn)業(yè)創(chuàng)新?
通過市場化的運營和服務體系,實現(xiàn)算力資源統(tǒng)籌調(diào)度
打開國家超算互聯(lián)網(wǎng)“商品廣場”,由復旦大學類腦智能科學與技術(shù)研究院開發(fā)的“數(shù)字孿生腦平臺”顯示在售。這個平臺整合了多模態(tài)的生物數(shù)據(jù)和先驗知識,利用超算集群計算資源,將相關(guān)數(shù)據(jù)與算法集成為一個數(shù)字孿生的腦模擬平臺,為腦科學與類腦智能研究提供服務支撐。用戶在國家超算互聯(lián)網(wǎng)上填寫使用申請表后,即可申請試用“數(shù)字孿生腦平臺”。詳情頁上,“商品說明”“服務與支持”“客戶案例”“商品評價”等信息一目了然。
在國家超算互聯(lián)網(wǎng)平臺上,科研人員、仿真工程師、人工智能研發(fā)人員可以像網(wǎng)絡購物一樣方便地購買和使用算力基礎(chǔ)資源、應用軟件、應用平臺、數(shù)據(jù)資產(chǎn)等,并按照軟件類型、算力、時長等付費。
超算,即超級計算或高性能計算,經(jīng)常應用于高精尖科研領(lǐng)域,被視為科技突破的“發(fā)動機”。如何更好地發(fā)揮超算的性能、高效求解各類應用中的科學問題,是超算發(fā)展的關(guān)鍵。
近年來,隨著超算與人工智能、大數(shù)據(jù)等新技術(shù)持續(xù)融合,超算應用場景日益豐富,服務科學研究、產(chǎn)業(yè)發(fā)展的方方面面,成為科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新的重要驅(qū)動力。另一方面,算力已從單純以性能比拼,過渡到服務能力、計算應用、綠色低碳等新優(yōu)勢的比拼,對超算環(huán)境和應用提出了更高的要求。
在此背景下,2023年4月,國家超算互聯(lián)網(wǎng)正式啟動建設,目標是突破現(xiàn)有單體超算中心運營模式,緊密連接供需方,通過市場化的運營和服務體系,實現(xiàn)算力資源統(tǒng)籌調(diào)度,以應對算力設施分布不均衡、接口不統(tǒng)一、應用軟件自主研發(fā)和推廣不足等問題,有效支撐原始科學創(chuàng)新、重大工程突破、經(jīng)濟高質(zhì)量發(fā)展等目標,成為支撐數(shù)字中國建設的“高速路”。
國家超算互聯(lián)網(wǎng)依托一體化的算力調(diào)度、數(shù)據(jù)傳輸、生態(tài)協(xié)作體系,實現(xiàn)算力供給、軟件開發(fā)、數(shù)據(jù)交易、模型服務等產(chǎn)業(yè)鏈各主體的緊密連接,構(gòu)建市場化、互聯(lián)網(wǎng)化、服務化、標準化的高性能計算服務環(huán)境。經(jīng)過近一年建設,國家超算互聯(lián)網(wǎng)工作取得了突破性進展,并完成了首階段的建設目標。
從“提供算力”向“提供服務”轉(zhuǎn)變,國家超算互聯(lián)網(wǎng)有望促使超算應用模式轉(zhuǎn)變。中國科學院院士、超算互聯(lián)網(wǎng)總體專家組組長錢德沛解釋道:“狹義上,國家超算互聯(lián)網(wǎng)通過高速網(wǎng)絡將全國眾多的超算中心連接起來,構(gòu)建統(tǒng)一使用、對外服務的基礎(chǔ)設施。廣義上,則是通過互聯(lián)網(wǎng)的形式,方便更多用戶獲取資源。同時,軟件和服務也可以給更多人使用,實現(xiàn)計算資源、軟件資源、應用解決方案資源的深度整合,從根本上提高超算的應用水平。”
在超算互聯(lián)網(wǎng)總體專家組副組長、上海交通大學教授管海兵看來,我國超算發(fā)展經(jīng)歷了硬件積累、軟件創(chuàng)新到高性能計算環(huán)境建設的發(fā)展階段,以互聯(lián)網(wǎng)思維來運營超算算力,把相關(guān)軟硬件、從業(yè)者和計算能力連接起來,能夠更好發(fā)揮超算作用,為經(jīng)濟社會發(fā)展服務。
已迭代100多個版本,建立了大型的基礎(chǔ)服務平臺
超算中心與智算中心、云計算中心的應用場景有明顯差異。云計算中心即傳統(tǒng)數(shù)據(jù)中心,主要提供通用算力、大數(shù)據(jù)分析等服務,在數(shù)據(jù)存儲和虛擬化等方面具備優(yōu)勢;智算中心則主要應用于人工智能、機器學習、圖像處理、語音識別等領(lǐng)域,這些應用需要快速迭代和優(yōu)化模型,對計算效率要求較高;超算中心通常由大量的計算節(jié)點和高速互聯(lián)網(wǎng)絡組成,可同時進行大量并行計算任務,應用于大規(guī)??茖W計算、工程仿真、氣象預報等。
“很多的科學計算里面需要人工智能技術(shù),很多人工智能應用也需要高精度、混合精度的計算。未來,單一精度的計算會變少,混合精度的計算會成為主流。多元融合、超智融合將是算力基礎(chǔ)設施發(fā)展的重要趨勢。”國家高性能計算機工程技術(shù)研究中心副主任曹振南說。
中國信息通信研究院副院長王志勤認為,過去的通用算力正逐漸向超算、智算、通用算力三種類型方向發(fā)展,“因此,分散化的算力如何通過更好的機制實現(xiàn)互聯(lián)互通,亟須一些新技術(shù)、新模式的探索。”
曹振南介紹,架構(gòu)上,國家超算互聯(lián)網(wǎng)可分為3層。最底層是匯聚各個不同算力中心的異構(gòu)算力資源;中間通過一體化服務與調(diào)度平臺,進行分布式異構(gòu)算力資源調(diào)度,與應用服務化封裝、發(fā)布、管理,包括面向不同用戶、不同資源的各類管理、交易、作業(yè)等;最上層則建立了算力應用商店,為用戶提供各種算力、軟件、數(shù)據(jù)、模型、源碼、技術(shù)等。
國家超算互聯(lián)網(wǎng)建設過程中,多家國家/區(qū)域超算中心、應用軟件單位、支撐單位,以及從事超算相關(guān)領(lǐng)域的企業(yè)和高校院所等組織成立了超算互聯(lián)網(wǎng)聯(lián)合體。成員單位從成立時的22家擴展到現(xiàn)在的128家。聯(lián)合體還成立了工作組和研發(fā)團隊,開展相關(guān)設計研發(fā)工作。
“同時,我們也希望用互聯(lián)網(wǎng)的模式‘共創(chuàng)’整個國家超算互聯(lián)網(wǎng)。在研發(fā)過程中,有500多個共創(chuàng)者參與進來,進行軟件打包、適配、軟件應用設計等工作,來自各個行業(yè)的1000多位‘體驗官’給我們提出了很多寶貴意見。一年來,國家超算互聯(lián)網(wǎng)平臺已迭代100多個版本,形成10個主要模塊和100萬行以上的源代碼,建立了大型的基礎(chǔ)服務平臺。”曹振南說。
曹振南表示,面向未來,國家超算互聯(lián)網(wǎng)要建立更多元的算力服務模式和更多樣的資源部署模式。“我們希望為用戶提供‘一點接入、隨取隨用’的服務。用戶無需關(guān)注算力類型、地理位置、軟件歸屬,甚至不需要知道誰在為你服務。”
建立良好的商業(yè)模式,使更多行業(yè)和領(lǐng)域受益于超算
近年來,我國在超算互聯(lián)網(wǎng)領(lǐng)域已經(jīng)開展了一些探索和實踐。
比如,國家超算無錫中心聯(lián)合國家超算廣州中心等超算中心,以及清華大學、之江實驗室等應用單位開展了超算互聯(lián)網(wǎng)技術(shù)體系和應用模式研究;山東上線超算互聯(lián)網(wǎng)工程,以實現(xiàn)數(shù)據(jù)和算力的互聯(lián)互通,打造“山東算網(wǎng)”。2023年10月,工業(yè)和信息化部等6部門印發(fā)了《算力基礎(chǔ)設施高質(zhì)量發(fā)展行動計劃》,提出“探索構(gòu)建布局合理、泛在連接、靈活高效的算力互聯(lián)網(wǎng)”。
中國科學院院士鄂維南認為,國家超算互聯(lián)網(wǎng)應用生態(tài)的打造,有利于降低超算應用門檻,加快科學計算和人工智能等技術(shù)的發(fā)展。華大生命科學研究院生物信息首席科學家黎宇翔表示,有了國家超算互聯(lián)網(wǎng),相當于打通了算力服務的“最后一公里”,可以基于自己的平臺跟國家超算互聯(lián)網(wǎng)結(jié)合,進行跨區(qū)域的數(shù)據(jù)傳輸和計算,選擇最合適的算力類型,適配具體的應用。
在國家超算天津中心黨組書記、應用研發(fā)首席科學家孟祥飛看來,經(jīng)過多年發(fā)展,我國超算研制和建設已經(jīng)規(guī)?;纬闪藦V泛的超算算力布局能力。“從算力供給側(cè)來說,超算‘微—宏’架構(gòu)差異越來越大,可擴展性、可靠性、可編程性等方面也面臨巨大的挑戰(zhàn)。新的數(shù)據(jù)范式的發(fā)展,使得超級計算機要兼顧數(shù)值計算、數(shù)據(jù)處理等各方面的應用需求,它的支撐能力也面臨著巨大的挑戰(zhàn)。從需求側(cè)來說,重大科學與工程領(lǐng)域面臨巨大的多元化算力需求,而多學科交叉、多領(lǐng)域團隊協(xié)同的系統(tǒng)性創(chuàng)新,底層需要有一個綜合能力的信息化載體、算力載體來支撐。”
中國工程院院士、清華大學教授鄭緯民認為,推動國家超算互聯(lián)網(wǎng)平臺再上新臺階,一是要提升平臺的互聯(lián)帶寬,二是要將超算節(jié)點之間的互通做好,統(tǒng)一編程框架,使一個程序可以在不同機器上運行,三是要進一步挖掘超算互聯(lián)網(wǎng)平臺的新應用。
錢德沛說:“構(gòu)建支撐應用的國家超算互聯(lián)網(wǎng),不單要做網(wǎng)絡,更重要的是建立超算互聯(lián)網(wǎng)平臺上各角色之間良好的商業(yè)模型,鼓勵更多的力量投入超算應用事業(yè),使更多行業(yè)和領(lǐng)域受益于超算,讓超算資源得到充分應用,成為支撐國家創(chuàng)新發(fā)展的基礎(chǔ)設施。”
標簽: