不僅“上知天文、下知地理”,似乎還能對答如流、出口成詩,甚至還能寫劇本、編音樂、寫代碼——最近,一款名叫ChatGPT的人工智能聊天機器人火爆全球。由此,一系列關于新一代技術變革、人工智能替代人力、巨頭企業(yè)扎堆入局AI的討論在互聯(lián)網(wǎng)上甚囂塵上,并引發(fā)資本市場跟進炒作。
然而,隨著越來越多的用戶實測結果不及預期,許多人也在重新審視ChatGPT是否真如想象中那么完美。熱鬧過后,也許是時候開始冷靜思考,ChatGPT的發(fā)展模式面臨哪些不可規(guī)避的問題和風險?這對我國人工智能發(fā)展有何重要啟示?
ChatGPT頁面截圖。
【資料圖】
ChatGPT 的“無所不能”和“無能為力”
問:“ChatGPT和其他聊天機器人有什么不同?”
答:“ChatGPT是一種先進的語言模型,具有更強的語言能力和知識范圍,能夠與用戶進行更自然有效的對話。”
以上是人民網(wǎng)財經(jīng)和ChatGPT的一組對話截圖。
正如ChatGPT在回答人民網(wǎng)財經(jīng)提問時所言,相較于此前科技企業(yè)推出的聊天機器人,ChatGPT在智能化程度上大幅提升,給對話者的感覺也“更聰明”。
2022年11月底,ChatGPT由美國一家名為OpenAI的人工智能研究公司推出,可以實現(xiàn)與用戶之間的智能聊天對話,屬于偏任務型的多輪對話和問答系統(tǒng)。
“ChatGPT的出現(xiàn),是人工智能技術發(fā)展的一次飛躍?!眰鞑热菡J知全國重點實驗室首席科學家張勇東表示,其在交互和創(chuàng)作方面展現(xiàn)的出色能力,標志人工智能由決策式向生成式轉變。
中國信通院云計算與大數(shù)據(jù)研究所內容科技部副主任石霖介紹,ChatGPT的技術基于OpenAI開發(fā)的GPT3.5系列模型。該模型參數(shù)規(guī)模據(jù)推測達十億級別,加之在訓練過程中引入人類反饋機制技術,使得ChatGPT在回答準確率、道德表現(xiàn)上進一步得到提升。
近期,有研究發(fā)現(xiàn),ChatGPT的“聰明”程度足以通過美國行醫(yī)執(zhí)照、研究生入學等考試。清華大學計算機科學與技術系教授黃民烈表示,目前ChatGPT的對話能力已超出人類平均水準,未來其能達到的類人對話水平值得期待。
不過,看似“無所不能”的ChatGPT,也會存在“無能為力”的尷尬。
如,目前ChatGPT難以進行高級邏輯處理。在完成“多準快全”的基本資料梳理和內容整合后,ChatGPT尚不能提供綜合判斷、修改調整、邏輯完善等“畫龍點睛”之筆,而這恰恰是人類高級智慧的體現(xiàn)。
此外,用于ChatGPT語言模型訓練的數(shù)據(jù)為2021年底前的數(shù)據(jù),因此在一些最新的數(shù)據(jù)和事件方面它可能會存在滯后。這在一定程度上造成了ChatGPT在內容準確性和知識性上的短板。不少用戶反映它經(jīng)?!耙槐菊?jīng)地胡說八道”。
ChatGPT在常識問題和算術題上出現(xiàn)錯誤,被網(wǎng)友戲稱“一本正經(jīng)地胡說八道”。
預訓練“機器人”潛藏侵權風險和監(jiān)管隱憂
以ChatGPT為代表的預訓練模型“機器人”,在預訓練過程中需要“投喂”海量數(shù)據(jù),才能使得模型能夠成功理解人類語言并模擬出愈加真實的類人表達方式。
據(jù)OpenAI的相關論文透露,ChatGPT的訓練集使用了總計約320TB的文字信息,涵蓋超4000億詞和約31億個網(wǎng)頁,其中包括來自新聞、博客、社交媒體的內容。
但這種未經(jīng)授權獲取文本數(shù)據(jù)的預訓練方式已引發(fā)爭議和不滿。推特(Twitter)現(xiàn)任首席執(zhí)行官埃隆·馬斯克就于近日宣布,叫停ChatGPT訪問Twitter數(shù)據(jù)庫來獲取培訓數(shù)據(jù),聲稱“需要更多了解OpenAI的治理結構和未來收入計劃”。
無獨有偶,近日,擁有國際性體育資源的蓋蒂圖片社對同為人工智能企業(yè)的Stability AI提起訴訟,指責其未經(jīng)許可從其數(shù)據(jù)庫中復制了1200多萬張圖片,用于建立競爭性業(yè)務,并侵犯了該公司的版權和商標保護權。
左圖為蓋蒂圖片社原圖,右圖為人工智能生成的圖像,其包含了蓋蒂圖片社的版權水印,側面印證了人工智能在學習過程中誤將水印理解成了圖片的一部分。圖片來源于網(wǎng)絡
張勇東表示,類似ChatGPT這樣的預訓練模型,其訓練數(shù)據(jù)往往來源于書籍、網(wǎng)站等,而其用于訓練的語料未經(jīng)授權,存在版權風險。且這種訓練過程往往不對外公開,訓練數(shù)據(jù)也不對外公布,因此版權擁有者并不知情。待模型完成后,生成的內容往往是原始訓練數(shù)據(jù)的某種組合,對外服務過程中就會存在侵犯原始版權的問題。
“這點與搜索引擎的服務機制不同。搜索引擎只是提供原始內容的鏈接,但ChatGPT則是以自身生成內容的形式提供服務,甚至連模型自己都無法確認是參考或綜合了哪些原始素材?!彼f。
正因如此,對于人工智能生成內容不能全盤接收,要注意甄別風險、加強監(jiān)管,正成為業(yè)界共識。
近日,OpenAI首席技術官米拉·穆拉蒂在接受媒體采訪時坦言,和其他聊天機器人一樣,ChatGPT可能會編造事實,也可能會被壞人利用,需要政府部門盡早介入進行監(jiān)管。
“從長遠來看,社會各界應該積極推動制定人工智能生成內容(AIGC)的規(guī)范標準。世界各國應該共同努力,基于海量數(shù)據(jù)研發(fā)生產(chǎn)出更加符合全人類道德價值標準的內容。”張勇東說。
他建議,要強化數(shù)據(jù)源頭把控,尤其是對涉及隱私、倫理、道德、政治偏見和種族主義等內容,要進行更嚴格的數(shù)據(jù)審查和清洗。
石霖建議,應加快布局人工智能安全標準、倫理規(guī)則的研究,針對人工智能新技術可能帶來的版權風險、內容風險等推動形成行業(yè)自律。同時,還應做好AIGC技術應用的科普工作,提升民眾的科學素養(yǎng)和風險認識。
炒作“啞火”后思考行業(yè)長遠發(fā)展
ChatGPT的爆紅,讓OpenAI賺到了第一桶金,也讓各路資本爭相入局。
2023年1月,微軟再次宣布向 OpenAI 投資數(shù)十億美元。據(jù)了解,這是目前人工智能領域規(guī)模最大的一筆投資。投資機構紅杉資本預測,未來AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值。
連日來,A股市場也經(jīng)歷了人工智能概念股大幅波動。但隨著監(jiān)管函的下達,炒作現(xiàn)象逐漸開始“啞火”,更多關于人工智能行業(yè)長遠發(fā)展的思考和理性聲音正在出現(xiàn)。
針對人工智能將取代部分人類職業(yè)的網(wǎng)絡討論,張勇東直言,人工智能技術距離真正達到類人的程度還有很長一段路要走。目前以ChatGPT為代表的AIGC在邏輯性、可解釋性和可溯源性方面都有待完善。
“國際上先進的人工智能發(fā)展都不是一蹴而就的,而是有跡可循、不斷突破的?!比斯ぶ悄芷髽I(yè)智譜AI首席執(zhí)行官張鵬表示,“ChatGPT的出現(xiàn)是否意味著人工智能已經(jīng)‘踩’到了通用人工智能這一終極目標的‘門檻’,還需冷靜看待?!?/p>
多位行業(yè)專家表示,可以預見的是,在“人機共生”的未來時代,人工智能確將解放人類、提高效率,但其身份是“助手”而非“主人”。
而針對ChatGPT爆火引發(fā)的對國內人工智能產(chǎn)業(yè)的質疑,也需要用更加全面的眼光來看待。
多年來,我國人工智能產(chǎn)業(yè)在生態(tài)完善、技術研發(fā)、應用推廣、人才建設等方面不斷培育優(yōu)勢:過去十年間專利申請量位居世界第一,核心產(chǎn)業(yè)規(guī)模超過4000億元。國際市場分析機構Gartner在研究報告中指出,阿里巴巴、百度、騰訊等科技企業(yè)在語言AI技術上的排名進入世界前十位……
“ChatGPT的成功再次給我們提了個醒,人工智能的發(fā)展需要在基礎研究和技術研發(fā)方面不懈堅持?!睆堸i表示,過去我國人工智能產(chǎn)業(yè)對基礎設施和技術的重視和投入不足。未來,如何發(fā)揮長處、補齊短板,真正實現(xiàn)我國人工智能領域的關鍵躍升,值得期待。
展望未來,石霖認為,以ChatGPT為代表的AIGC技術應用,將形成“智能底座+服務”的商業(yè)模式。AIGC技術應用還將進一步發(fā)揮在數(shù)據(jù)、算力和算法上構筑的技術壁壘優(yōu)勢,對人工智能的應用推廣帶來深層次變革。
他指出,AIGC技術應用正在軟件代碼編寫、工業(yè)設計、分子結構預測、基因編輯等科研生產(chǎn)領域探索應用場景,幫助縮短研發(fā)周期、降低試驗成本,也將改變軟件、工業(yè)、醫(yī)療、生物等行業(yè)運行模式。
張勇東表示,過去十年,人工智能領域主要圍繞更好的感知和理解來發(fā)展,比如自動駕駛、數(shù)字醫(yī)療。未來十年,人工智能領域深層技術有望不斷突破,將具備重塑數(shù)字化內容生產(chǎn)和消費模式的強大潛力。
深度學習技術及應用國家工程研究中心主任、百度首席技術官王海峰認為,融合大規(guī)模知識的深度學習是人工智能發(fā)展的重要方向。要聯(lián)合產(chǎn)學研各方力量,探索協(xié)同育人創(chuàng)新模式,建立全方位多層次的人工智能人才培養(yǎng)體系。