(資料圖片僅供參考)
封面新聞?dòng)浾?孟梅 歐陽(yáng)宏宇
7月7日,2023世界人工智能大會(huì)(WAIC)“聚焦·大模型時(shí)代AIGC新浪潮—可信AI”論壇舉行,螞蟻集團(tuán)聯(lián)合清華大學(xué)發(fā)布AI安全檢測(cè)平臺(tái)“蟻鑒2.0”。蟻鑒2.0可實(shí)現(xiàn)用生成式AI能力檢測(cè)生成式AI模型,可識(shí)別數(shù)據(jù)安全、內(nèi)容安全、科技倫理三大類(lèi)的數(shù)百種風(fēng)險(xiǎn),覆蓋表格、文本、圖像等多種數(shù)據(jù)和任務(wù)類(lèi)型,是業(yè)內(nèi)首個(gè)實(shí)現(xiàn)產(chǎn)業(yè)級(jí)應(yīng)用的全數(shù)據(jù)類(lèi)型AI安全檢測(cè)平臺(tái)。據(jù)了解,該產(chǎn)品還入選了本屆大會(huì)的“鎮(zhèn)館之寶”。
AIGC安全成為當(dāng)前人工智能研究發(fā)展的重要議題。中國(guó)科學(xué)院院士何積豐發(fā)表《可信人工智能展望》主題演講。他認(rèn)為,“不能再將人工智能視為簡(jiǎn)單的技術(shù)工作,而是成為整個(gè)組織的變革引擎??尚湃斯ぶ悄芤铝τ诒U蠑?shù)據(jù)安全可信、系統(tǒng)行為可追責(zé)、算法模型可解釋、網(wǎng)絡(luò)環(huán)境可信、法律倫理可信等問(wèn)題。”
在該論壇上,螞蟻集團(tuán)同時(shí)宣布,“蟻鑒2.0”全面開(kāi)放,面向全球開(kāi)發(fā)者免費(fèi)提供AIGC安全性、AI可解釋性、AI魯棒性三項(xiàng)檢測(cè)工具,可服務(wù)于數(shù)字金融、教育、文化、醫(yī)療、電商等領(lǐng)域的大規(guī)模復(fù)雜業(yè)務(wù)場(chǎng)景。
據(jù)了解,“蟻鑒2.0”的兩項(xiàng)硬核能力,一是實(shí)現(xiàn)了用生成式能力檢測(cè)生成式模型。檢測(cè)標(biāo)準(zhǔn)覆蓋內(nèi)容安全、數(shù)據(jù)安全、倫理安全三大類(lèi),可對(duì)大模型生成式內(nèi)容完成包含個(gè)人隱私、意識(shí)形態(tài)、違法犯罪、偏見(jiàn)與歧視等數(shù)百個(gè)維度的風(fēng)險(xiǎn)對(duì)抗檢測(cè),并會(huì)生成檢測(cè)報(bào)告,幫助大模型更加有針對(duì)性地持續(xù)優(yōu)化。
螞蟻集團(tuán)大安全事業(yè)群技術(shù)部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術(shù),‘蟻鑒2.0’通過(guò)智能博弈對(duì)抗技術(shù),模擬黑產(chǎn)以及自動(dòng)化生成海量測(cè)試集,可實(shí)現(xiàn)「生成式機(jī)器人」對(duì)「AIGC生成式模型」的誘導(dǎo)式檢測(cè)計(jì)算,很像一個(gè)24小時(shí)不眠不休的‘安全黑客’在找茬大模型,從而找到大模型存在的弱點(diǎn)和安全問(wèn)題所在。這種AI對(duì)AI的評(píng)測(cè),也是教學(xué)相長(zhǎng)。好比生成式考官考核生成式運(yùn)動(dòng)員,在對(duì)抗中雙方能力互相提升,進(jìn)一步提高整個(gè)行業(yè)的AI安全水位?!?/p>
另一項(xiàng)硬核能力是,“蟻鑒2.0”融入了可解釋性檢測(cè)工具。綜合AI技術(shù)和專(zhuān)家先驗(yàn)知識(shí),通過(guò)可視化、邏輯推理、因果推斷等技術(shù),從完整性、準(zhǔn)確性、穩(wěn)定性等7個(gè)維度及20余項(xiàng)評(píng)估指標(biāo),對(duì)AI系統(tǒng)的解釋質(zhì)量量化分析,幫助用戶更清晰驗(yàn)證與優(yōu)化可解釋方案。
據(jù)了解,“蟻鑒2.0”集成了螞蟻近10年可信AI實(shí)踐、1000余項(xiàng)可信AI專(zhuān)利,支持零編碼測(cè)評(píng)。開(kāi)發(fā)者通過(guò)API接口,將AI模型接入蟻鑒,就可以一鍵識(shí)別和挖掘模型漏洞。
螞蟻集團(tuán)認(rèn)為,人工智能的深度應(yīng)用,不僅對(duì)數(shù)據(jù)、算法、算力提出了更高要求,也對(duì)安全、隱私、倫理提出更多挑戰(zhàn)。在確保數(shù)據(jù)安全和隱私保護(hù)、健全人工智能倫理與安全的前提下,才能讓AI技術(shù)真正地釋放應(yīng)用價(jià)值。
此次論壇上,中國(guó)信通院、上海人工智能實(shí)驗(yàn)室、武漢大學(xué)、螞蟻集團(tuán)等多家單位共同發(fā)起的《AIGC可信倡議》。該倡議得到數(shù)十家單位參與,圍繞人工智能可能引發(fā)的經(jīng)濟(jì)、安全、隱私和數(shù)據(jù)治理等問(wèn)題,提出構(gòu)建AIGC可信發(fā)展的全球治理合作框架,采用安全可信的數(shù)據(jù)資源、技術(shù)框架、計(jì)算方法和軟件平臺(tái)等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。
標(biāo)簽: