日前,微軟宣布6月底擬裁撤近80名外包編輯,由AI編輯負責(zé)接下來的MSN網(wǎng)站的新聞抓取、排版和配圖等工作。但沒想到,剛到崗沒多久,AI編輯就“翻車”了,而且犯了一個非常低級的錯誤。AI編輯在尋找配圖的時候,把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。
針對此次微軟AI的配圖錯誤事件,Jade也在社交媒體上表達了不滿:“正常區(qū)分兩個不同膚色的人有那么難嗎?”為何一向以高識別率著稱的AI,這次卻“翻車”了?
解決臉盲問題需要不斷擴大學(xué)習(xí)范圍
人臉識別技術(shù)是目前AI領(lǐng)域公認的比較成熟的技術(shù),圈內(nèi)人士也熱衷像刷分一樣把人臉識別準(zhǔn)確率屢屢刷出新高,最高的號稱準(zhǔn)確率可達99.9%。人臉識別技術(shù)有如此輝煌的戰(zhàn)績,為何此次AI編輯還會臉盲呢?
“人臉識別技術(shù)的工作原理,主要是比對五官比例以及面部特征。”天津大學(xué)智能與計算學(xué)部教授韓亞洪解釋,簡單說,就是基于人臉圖像的大數(shù)據(jù),先對看到的人臉圖像進行預(yù)處理,提取面部各個方面的特征,并通過分層多次提取,尋找對于識別個體人臉最有效的特征表達。
人臉識別技術(shù)這些年已經(jīng)發(fā)生了重大的變化,傳統(tǒng)的人臉識別方法已經(jīng)被基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法替代。深度學(xué)習(xí)方法的主要優(yōu)勢是它們可通過大規(guī)模數(shù)據(jù)集進行訓(xùn)練,從而學(xué)習(xí)到這些數(shù)據(jù)的最佳特征。
“雖然可以使用大規(guī)模數(shù)據(jù)集進行訓(xùn)練,但是目前99.9%的準(zhǔn)確率,基本上是在一些基準(zhǔn)的數(shù)據(jù)集上測試的結(jié)果。這個數(shù)據(jù)集肯定是有范圍的,如果收集的數(shù)據(jù)是在數(shù)據(jù)集分布的范圍內(nèi),便可獲得比較高的準(zhǔn)確率。”韓亞洪說。
據(jù)了解,目前號稱人臉識別準(zhǔn)確率達到99%以上的,很多指的都是和全世界最權(quán)威的人臉數(shù)據(jù)庫LFW(Labeled Faces in the Wild)進行比對測試的成績。LFW可以被認作一個考查深度學(xué)習(xí)系統(tǒng)人臉識別能力的題庫。它從互聯(lián)網(wǎng)上提取6000張不同朝向、表情和光照環(huán)境的人臉照片作為考題,可以讓任何系統(tǒng)在里面“跑分”。“跑分”過程是LFW給出一對照片,詢問測試系統(tǒng)兩張照片是不是同一個人,系統(tǒng)給出yes或no的答案。
“解決特定的臉盲問題并不難,其實就是重新針對任務(wù),收集這項任務(wù)領(lǐng)域內(nèi)的人臉圖像,在原有算法模型上訓(xùn)練,或者重新設(shè)計新的算法模型進行訓(xùn)練,都會提高人臉識別率,以滿足實際應(yīng)用的需求。”韓亞洪說,但是超出了特定任務(wù),AI的“臉盲癥”就會復(fù)發(fā)。目前并沒有哪個通用的模型算法可以解決所有的任務(wù),但是AI可以通過不斷地調(diào)整,大量的學(xué)習(xí),從而提高人臉識別的準(zhǔn)確性。
深度神經(jīng)網(wǎng)絡(luò)模型是進階的必要條件
“目前針對新聞文檔的分析和處理任務(wù),AI編輯做起來相對得心應(yīng)手。”韓亞洪介紹,具體地說,比如在一篇很長的報道中,讓AI編輯把重點摘出來,這是沒有問題的?,F(xiàn)在是多媒體時代,大量的新聞報道會涉及圖片和視頻,AI編輯可以將圖片或者視頻自動提取出來,再從大篇幅的文字報道中,選取與之相匹配的文字說明,這個工作AI是可以比較準(zhǔn)確地做到的。
“解決特定領(lǐng)域的問題,AI大多時候還是沒問題的,但是要實現(xiàn)通用,就比較難了。”韓亞洪強調(diào),實現(xiàn)這些功能需要用到自然語言處理、模式識別、圖像視頻理解等領(lǐng)域的技術(shù)。
要培養(yǎng)一名AI編輯,首先需要收集大量的新聞報道和圖片視頻,再根據(jù)收集到的數(shù)據(jù)設(shè)計一個針對這個任務(wù)的深度神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)模型里會有很多參數(shù),然后通過數(shù)據(jù)把參數(shù)訓(xùn)練出來,它就具備了最初設(shè)定的各種編輯能力了。在使用過程中,隨著AI編輯學(xué)習(xí)了更多的新聞,它的業(yè)務(wù)能力和性能也將不斷提升。
“不過目前的新聞生產(chǎn)對于AI編輯來說還很困難。”韓亞洪說,要讓AI學(xué)會寫新聞,必須要針對某個特定新聞主題,進行大量資料搜集和模型訓(xùn)練。目前AI技術(shù)只能在風(fēng)格相對固定、詞匯量使用范圍較小的領(lǐng)域完成文本生成,比如天氣預(yù)報等內(nèi)容,AI可以很好地輸出相關(guān)報道和消息。但要生成人類創(chuàng)作的那種有創(chuàng)新要求、情感描述豐富的文章,AI編輯的能力仍有待進一步提升。
協(xié)作將使新聞生產(chǎn)更加高效
“有趣的是,AI犯的錯誤大多是我們意想不到的低級錯誤,但在某些方面又強悍到讓人類望塵莫及。”韓亞洪舉例說,像給文章分類這種工作,人類編輯要進行大量閱讀,重復(fù)性勞動耗時耗力,速度非常慢。但這項工作AI編輯做起來就非常簡單了,通過文字—文檔的主題建模,AI可以比較準(zhǔn)確地對文章按主題進行分類。另外,對于可以使用模板的短新聞,比如天氣預(yù)報、證券信息等,AI編輯可以準(zhǔn)確迅速地將各種數(shù)字或者專有名詞嵌套到模板中,從而完成一定的文檔生成任務(wù)。
美聯(lián)社曾使用AI系統(tǒng)自動編發(fā)企業(yè)財報。AI系統(tǒng)對數(shù)據(jù)進行自動抓取,將其嵌套在美聯(lián)社預(yù)先設(shè)定的新聞模板中,幾秒鐘就能完成一篇150—300字的短消息,該系統(tǒng)每季度能產(chǎn)出約4000篇新聞,與之相比,美聯(lián)社的人工編輯們每季度只能完成400篇。
做這些特定的工作,AI編輯比人類厲害的地方不僅在于速度,準(zhǔn)確率也可圈可點。“像分類或者是嵌套模板寫短消息這類的工作,因為任務(wù)明確,AI的準(zhǔn)確率還是非常高的,很少出現(xiàn)錯別字或者數(shù)據(jù)錯誤。”韓亞洪介紹。
在運用大數(shù)據(jù)分析預(yù)測爆款方面,AI編輯可能比人類單純從經(jīng)驗出發(fā)顯得更“科學(xué)”。2015年,《紐約時報》使用AI機器人對社交平臺中的文章進行篩選和分析,預(yù)測哪部分內(nèi)容適合推廣。凡是由它自動推薦的文章的點擊量都大大增加,甚至達到了普通文章的38倍。
“但在AI編輯的世界中,只有知道和不知道兩種狀態(tài),因此處理的內(nèi)容一旦超綱,它們就會立刻犯很多低級到可笑的錯誤。”韓亞洪說,像這次AI編輯把非裔的Leigh跟阿拉伯裔的Jade弄混了的這樣的錯誤,對于人類來說,即使沒見過Leigh ,但根據(jù)常識,也不會把非洲裔和阿拉伯裔弄混。
“目前階段的編輯工作完全依賴AI是不現(xiàn)實的,讓AI成為人類編輯的幫手似乎更切實可行。”韓亞洪說。美聯(lián)社預(yù)測,AI介入媒體行業(yè)能夠幫助新聞工作者釋放20%左右的時間,讓后者可以將這部分時間更多地投入到內(nèi)容創(chuàng)作方面,簡單的事實核查與調(diào)研方面的工作交給AI,有利于提高新聞質(zhì)量。
“未來,人類應(yīng)該把AI編輯當(dāng)作合作伙伴,雙方協(xié)同起來,使工作更加高效有質(zhì)量。”韓亞洪說,人類不應(yīng)該覺得AI是來“搶飯碗”的,而應(yīng)該為有AI這樣的合作伙伴而感到幸運。