久久久久精品一区二区三区不卡_2020国产精品午夜视频_下载91香蕉视频_丁香婷婷在线观看_日韩在线中文字幕av

您現(xiàn)在的位置：首頁 >
家居 >
正文

大語言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？當前視點

來源：程序員客棧時間：2023-06-17 07:19:25

Datawhale干貨

(相關(guān)資料圖)

作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士

今天晚上，花了一點兒時間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現(xiàn)現(xiàn)象。

大規(guī)模神經(jīng)網(wǎng)絡(luò)下的涌現(xiàn)現(xiàn)象

在機器學(xué)習(xí)中使用大規(guī)模神經(jīng)網(wǎng)絡(luò)時，由于增加了參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)或訓(xùn)練步驟等因素，出現(xiàn)了定性上的新能力和性質(zhì)，這些能力和性質(zhì)在小規(guī)模神經(jīng)網(wǎng)絡(luò)中往往是不存在的。

第一篇文章舉了這個例子，每個圖都可以理解為一個任務(wù)，橫軸是神經(jīng)網(wǎng)絡(luò)的規(guī)模，而縱軸是準確率，可以理解為模型的性能。

我們拿圖一來看，在10的22次方前，這些模型基本上的性能基本上都很穩(wěn)定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個任務(wù)上都表現(xiàn)出類似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評論引用在這里：

作者發(fā)現(xiàn)，當我們訓(xùn)練用網(wǎng)絡(luò)計算同余加法 a+b = ? (mod c) 時，網(wǎng)絡(luò)在某個時間突然獲得了 100% 準確率。分析發(fā)現(xiàn)，神經(jīng)網(wǎng)絡(luò)實際上“頓悟”了使用傅立葉變換來計算同余加法！這個算法可以證明是正確的，反人類直覺的。

從這倆例子里面我的感受是，只要數(shù)據(jù)量足夠且真實，且模型沒有硬錯誤的前提下，不斷的訓(xùn)練說不定真的能夠產(chǎn)生一些意想不到的效果。

還有就是我覺得人類現(xiàn)在積累的知識并不少，但是系統(tǒng)的少，零星的多，如果類似ChatGPT這樣的大模型可以拿所有的人類已有知識進行不斷學(xué)習(xí)的話，我覺得有很大概率會讓它涌現(xiàn)出意想不到的能力。

甚至可能把人類的生產(chǎn)力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

標簽：

責(zé)任編輯：FD31

上一篇：全球新消息丨vivo全系列型號大全：從旗艦到入門級，一網(wǎng)打盡！

下一篇：最后一頁

精彩圖集(熱圖)

熱點圖集

七?。ㄊ校┛鐓^(qū)劃檢察協(xié)作守護秦嶺生態(tài)環(huán)境

點擊詳細
微速訊：轉(zhuǎn)發(fā)收藏！9組易混淆的大學(xué)專業(yè)

點擊詳細
諾基亞E51無攝像頭版：一個時代的回憶

點擊詳細
天天新資訊：持續(xù)發(fā)力植物照明，茂碩電源亮相世界頂級商業(yè)花卉園藝展GreenTech

點擊詳細
三星平板型號參數(shù)大全

點擊詳細
伊能靜攜7歲女兒臺北逛街，小米粒膝蓋傷疤明顯，小腿大塊淤青

點擊詳細
三國群英傳5秘籍大全_《三國群英傳8》全秘籍

點擊詳細
海南第172例造血干細胞捐獻者：想成為女兒眼中的“英雄爸爸” 當前快訊

點擊詳細
創(chuàng)意微視頻丨倒計時一天！廊坊經(jīng)洽會亮點大劇透！

點擊詳細
【全球快播報】2023鄭州經(jīng)開區(qū)公辦初中小升初報名指南

點擊詳細
河南省建筑業(yè)協(xié)會第二屆供需對接會?成功召開|環(huán)球快看

點擊詳細
一片綠色生發(fā)百變業(yè)態(tài)——“千萬工程”引領(lǐng)浙江鄉(xiāng)村綠色產(chǎn)業(yè)勃發(fā)

點擊詳細
邵陽市一中錄取分數(shù)線_市一中錄取分數(shù)線_焦點消息

點擊詳細
河北省社會組織“走出去”集中研討活動在石舉辦環(huán)球快資訊

點擊詳細
優(yōu)美的祝福語同學(xué)

點擊詳細
長沙市中心區(qū)域在哪里_長沙市中心

點擊詳細
【世界時快訊】手機排行榜2023前十名

點擊詳細
世界消息！央媒觀豫丨“這麥子地毯，比什么裝修都好看！”

點擊詳細

最近更新

大語言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？當前視點

點擊詳細
全球新消息丨vivo全系列型號大全：從旗艦到入門級，一網(wǎng)打盡！

點擊詳細
南京市公安局一級高級警長蔣浩接受紀律審查和監(jiān)察調(diào)查

點擊詳細
全球熱消息：匯豐控股：當日耗資約1.69億港元回購281.12萬股

點擊詳細
頭條焦點：激發(fā)國內(nèi)市場活力二季度消費市場有望保持平穩(wěn)增長態(tài)勢

點擊詳細
時空穿梭類小說兩百萬字以上的_時空穿梭類小說

點擊詳細
【全球快播報】2023鄭州經(jīng)開區(qū)公辦初中小升初報名指南

點擊詳細
白茶社區(qū)： “粽”情重意端午飄香

點擊詳細
普瑞眼科跌3.88% 某券商在其高點喊買入天天新視野

點擊詳細
微速訊：轉(zhuǎn)發(fā)收藏！9組易混淆的大學(xué)專業(yè)

點擊詳細
創(chuàng)意微視頻丨倒計時一天！廊坊經(jīng)洽會亮點大劇透！

點擊詳細
大連市對外開放暨招商引資大會開幕！金普現(xiàn)場簽24億！

點擊詳細
每日視點！我國首艘！成功交付

點擊詳細
銅壺?zé)莶韬玫氖钦娴膯醎銅壺?zé)莶韬?/h2>
點擊詳細
天天熱資訊！美國6月密歇根大學(xué)一年期通脹率預(yù)期初值為3.3%，前值為4.2%

點擊詳細
《東南傳播》2022年第08期新鮮出爐_東南傳播世界時快訊

點擊詳細
碧水源：股東擬減持不超過0.79%公司股份

點擊詳細
當前動態(tài):安徽省蚌埠市2023-06-12 09:08發(fā)布雷電黃色預(yù)警

點擊詳細
優(yōu)美的祝福語同學(xué)

點擊詳細
每日熱訊!光庫科技漲20.00%

點擊詳細
網(wǎng)傳大學(xué)生跟同伴游泳溺亡？廣西南寧理工學(xué)院嚴正聲明

點擊詳細
地鐵過江隧道進水了怎么辦？這場演練告訴你

點擊詳細
河南省建筑業(yè)協(xié)會第二屆供需對接會?成功召開|環(huán)球快看

點擊詳細
七?。ㄊ校┛鐓^(qū)劃檢察協(xié)作守護秦嶺生態(tài)環(huán)境

點擊詳細
世界消息！央媒觀豫丨“這麥子地毯，比什么裝修都好看！”

點擊詳細
市場迎來一段“幸福時光”

點擊詳細
速訊：最新粽子專項抽檢情況公布不合格樣品均為超范圍使用食品添加劑

點擊詳細
一片綠色生發(fā)百變業(yè)態(tài)——“千萬工程”引領(lǐng)浙江鄉(xiāng)村綠色產(chǎn)業(yè)勃發(fā)

點擊詳細
桐梓風(fēng)水：快樂籃球賽健康向未來

點擊詳細
“微手術(shù)”避免“通天口” 青濱附院實現(xiàn)一次手術(shù)治療兩種疾病

點擊詳細

熱詞榜

編輯推薦

精彩圖集

專題策劃

【天天熱聞】長江有色：16日鎳價小漲宏觀利好提振但現(xiàn)貨交投氛圍偏淡

信用中國

信用信息
行政許可和行政處罰
網(wǎng)站文章

瀏覽排行