“隨著2017年AlphaGoZero的面世,人工智能技術(shù)發(fā)展開啟了第四次浪潮。這個階段,人工的基本特點發(fā)生了改變?!痹?023年5月18日召開的中國家用電器技術(shù)大會上,中國科學技術(shù)大學教授陳小平在介紹人工智能新發(fā)展時如是說。
此次大會上,陳小平不僅對人工智能的大模型進行了詳細介紹,還分享了從大模型到柔性機器人的新發(fā)展,以及這些變化帶來的新機遇和挑戰(zhàn)。
陳小平在演講中指出,現(xiàn)階段,人工智能呈現(xiàn)出四大特點,即大任務(wù)、大訓練、大模型、大系統(tǒng)。
(資料圖)
其中,大任務(wù),指的是大規(guī)模的真實場景任務(wù),如下棋、聊天、語言翻譯、命題、作文、命題繪畫等。陳小平以圍棋為例,大模型抓取了超過1億全球用戶的真實場景,這在以往是非常少見的。
大訓練,則是指人工智能訓練法已經(jīng)從過去的大數(shù)據(jù)驅(qū)動,在2017年以后轉(zhuǎn)變?yōu)榇笥柧汄?qū)動。相比大數(shù)據(jù)驅(qū)動,大訓練驅(qū)動的具體表現(xiàn)為四項新要求。陳小平詳細介紹說:“第一,訓練數(shù)據(jù)的質(zhì)。在大數(shù)據(jù)驅(qū)動的時候,人工智能對數(shù)據(jù)的質(zhì)沒有要求,而現(xiàn)在強調(diào)的是原始數(shù)據(jù)。第二,訓練數(shù)據(jù)的量?,F(xiàn)在對人工智能原始數(shù)據(jù)的量給出了新的標準,就是人類規(guī)模。比如ChatGPT,有人分析它抓取了互聯(lián)網(wǎng)1/3到2/3的文本數(shù)據(jù)訓練。第三,數(shù)據(jù)獲取方式。因為原始數(shù)據(jù)為人類規(guī)模的量,這就必須要用自動或者半自動的方式抓取數(shù)據(jù)。第四,訓練結(jié)果發(fā)生了變化?,F(xiàn)在的訓練結(jié)果,是一種實例性的模型。”
大模型,就是經(jīng)過大訓練生成的大型實例性模型,例如,大型語言模型,也簡稱為大模型。大系統(tǒng)則是針對大任務(wù)、圍繞大模型、集成大量技術(shù)的集成智能系統(tǒng)?,F(xiàn)在的人工智能,是集成智能,它里面集成了非常多的、不同種類的智能技術(shù)。陳小平表示,中國想要抓住這一階段的發(fā)展機遇,非常關(guān)鍵的是要在概念上跟上時代,甚至是提前定義。
人工智能現(xiàn)階段的應(yīng)用是生成式的,且已不再是狹義的生成語言、圖像等內(nèi)容,而是從人到AI、從AI到人的交互?!拔艺J為,自然語言人機交互的重點是,會說話,能聽懂人話,能回答問題,但不能保證回答一定正確。對機器語言表達的基本要求,是說話要符合人的語言習慣?!标愋∑奖硎荆Z言習慣是什么,現(xiàn)在沒有科學標準,但是有經(jīng)驗標準。所以關(guān)鍵是要掌握并利用這個經(jīng)驗標準,這就要從人類規(guī)模語料中自動提取語言痕跡,并用于人機自然語言交互。
語言痕跡來源于原始語料。陳小平用兩個句子組成的語料進行簡單舉例:用于訓練的語料分別為“我要上網(wǎng),請打開瀏覽器?!薄拔乙牳?,請打開音響?!边@兩句話反復(fù)說,且概率分別為0.6和0.4。如果基于相鄰語元之間關(guān)聯(lián)度的預(yù)測,也就是給定一個語元,預(yù)測下一個出現(xiàn)的語元,不確定情況下預(yù)測錯誤率過高。比如從“要”預(yù)測“上網(wǎng)”的錯誤率達到40%。如果基于語言痕跡遠程關(guān)聯(lián)度時(遠距離語元之間的關(guān)聯(lián)強度),“上網(wǎng)”與“瀏覽器”語元雖然不相鄰,但具有高關(guān)聯(lián)度,若已出現(xiàn)“打開”和“上網(wǎng)”,預(yù)測出“瀏覽器”的錯誤率為0。
對此,陳小平表示,基于語言痕跡遠程關(guān)聯(lián)時,預(yù)測錯誤率可以大大降低。這也是為什么大家覺得大模型好用。“雖然舉例的兩個句子只有六個語元,但在實際應(yīng)用中,是從人類規(guī)模語料中提取語元關(guān)聯(lián)度,用于自然語言人機交互,數(shù)據(jù)的量很大。人工智能可以回看的語元至少超過4000個,甚至已經(jīng)有可以回看10萬個語元的大模型發(fā)布?!标愋∑街赋觯绻麑⒒ヂ?lián)網(wǎng)三分之一到三分之二的語言痕跡都抓取做成模型,大模型將非常強大。
上述所說的抓取語言痕跡,訓練語言痕跡,對語言痕跡做關(guān)聯(lián),被稱為預(yù)訓練模型。這是大模型技術(shù)體系中的一部分。陳小平表示,實際上,預(yù)訓練以后的實際效果可能不夠理想,不夠精細,此時就可以引入一種方法——細調(diào)。“細調(diào)類似于收音機的調(diào)臺旋鈕,一般收音機不清晰時,就需要細調(diào)旋鈕,直至內(nèi)容變得清晰。”陳小平表示,細調(diào)是專門訓練出的專用模型,通俗來說,不是大范圍的調(diào)整,而是有一個目標后,針對當前矛盾去細調(diào)。經(jīng)過細調(diào)后的大模型應(yīng)用效果會大幅提升。但是細調(diào)不是憑空實現(xiàn)的,需要大量的語言數(shù)據(jù)進行支撐,且用不同的數(shù)據(jù)進行不同的細調(diào)。例如聊天用聊天的細調(diào),編程用編程的細調(diào)。
然而,細調(diào)后的大模型效果可能還是不夠,還可以運用“提示”。“這是小規(guī)模的訓練,為用戶引導(dǎo)模型的回答。也就是在提問題時,不僅要提問,還要給出一些提示。如果提示說得好,回答的質(zhì)量也會大幅提升?!?
值得一提的是,大模型是實例性模型,是從訓練預(yù)料中提取的語元和語言關(guān)聯(lián)度的全體組成的模型,它沒有概括性規(guī)則,無法進行數(shù)學-邏輯推理?!按竽P褪且环N顛覆,我們需要用新的觀念、新的理念去看待。”陳小平說。
一些科幻電影刻畫出的機器人具有自己的情緒、情感,會有自己的思想。陳小平直言,擬人化想象對大模型以及所有通過了大規(guī)模驗證的人工智能都不成立?!凹词乖诤腿斯ぶ悄芙换サ墓ぷ髦?,會從語言中感受到情感、情緒,這也是因為語言的投射效應(yīng),即腦補。”陳小平表示,人說話都帶涵義,所以習慣性地將自己理解的涵義投射到大模型上,認為大模型說話也帶涵義?!皩Υ竽P腿斯ぶ悄茏鰯M人化想象,是不科學的。”
大模型的應(yīng)用,也將為人類帶來重大的機遇和挑戰(zhàn)。在機遇方面,陳小平表示,大模型可以應(yīng)用于很多場景,例如聊天、智能家居的人機交互、文案撰寫、智能客服等。人工智能的加持下,能解決很多以往大家無法解決的問題。
同時,大模型還會帶來新的挑戰(zhàn)。首先是公共安全,其次是就業(yè)問題?!?017年開啟人工智能第四次浪潮的標志性實踐,就是AlphaGoZero圍棋程序面世,且該程序的圍棋水平已經(jīng)超過職業(yè)選手?,F(xiàn)在,人類積累了千年的圍棋知識很少再是人工教授或者看書,大家都開始通過這個程序進行訓練和學習,人與人的對練已經(jīng)很少?!彼硎荆m然圍棋是很小的領(lǐng)域,但未來大模型的應(yīng)用可能會延伸到各領(lǐng)域,也有可能發(fā)生類似圍棋領(lǐng)域的情況,從而影響就業(yè)。
人工智能如何在物理世界中應(yīng)用,也是很大的挑戰(zhàn)。比如現(xiàn)實世界中的家庭、醫(yī)院、工業(yè)、農(nóng)業(yè)場景,現(xiàn)在的大模型是無法勝任的。陳小平表示,現(xiàn)在在工業(yè)上普遍應(yīng)用的機械臂,基本上都是剛性的,這類機器人重復(fù)精度高,但靈巧性、安全性低,適合用于結(jié)構(gòu)化環(huán)境。對于更復(fù)雜的非結(jié)構(gòu)化環(huán)境,需要精確測量、建模和計算,這就需要軟體機器臂(柔性機器人手臂),也就是軟體機器人。這類產(chǎn)品采用蜂巢氣動網(wǎng)絡(luò)結(jié)構(gòu),為材料-機構(gòu)-算法的一體化設(shè)計。據(jù)陳小平介紹,與傳統(tǒng)機械手臂相比,軟體機器人在制作成本、負載能力、后期維護等方面都具有較高的優(yōu)勢。陳小平在現(xiàn)場通過幾個視頻,分享了軟體機器人在喂飯、開門、擰瓶蓋、拉抽屜等多個場景的應(yīng)用。
對于人工智能在中國的應(yīng)用,陳小平表示:“我認為,對于中國,大模型在智能制造、智慧農(nóng)業(yè)、惠普養(yǎng)老三方面能得到很好的應(yīng)用后,將迎來巨大的機遇?!?
嚴正聲明:“電器微刊”所有原創(chuàng)文章,轉(zhuǎn)載均需獲授權(quán)。
標簽: