久久久久精品一区二区三区不卡_2020国产精品午夜视频_下载91香蕉视频_丁香婷婷在线观看_日韩在线中文字幕av

<strike id="oqo6g"><rt id="oqo6g"></rt></strike>

<ul id="oqo6g"></ul>

您現(xiàn)在的位置：首頁 >
要聞 >
正文

大模型開發(fā)者必備手冊(cè)：這些數(shù)字值得記住

來源：量子位時(shí)間：2023-05-19 14:23:21

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

GPT-4的使用成本，竟然是GPT-3.5的50倍之多；

(資料圖)

而讓大語言模型同時(shí)處理25個(gè)請(qǐng)求的時(shí)間，僅是處理單個(gè)請(qǐng)求的2倍……

這些數(shù)據(jù)聽上去可能有些出乎意料，但都是真實(shí)的。

它們出自一篇名為《大語言模型（LLM）開發(fā)者必須知道的數(shù)字》的GitHub文章。

文章發(fā)布之后僅1天，便獲得了1200次星標(biāo)。

文章基于真實(shí)的開發(fā)經(jīng)驗(yàn)，介紹了提示工程、硬件資源、價(jià)格等方面的數(shù)據(jù)。

就算沒有成為開發(fā)者的打算，拿來擴(kuò)充一下知識(shí)儲(chǔ)備也是極好的。

都有哪些數(shù)字值得關(guān)注

我們不妨先來看一下文章作者制作的速覽圖表：

接下來，我們就來詳細(xì)介紹一下這些數(shù)據(jù)。

提示工程

40-90%：在提示詞中加入“Be Concise”節(jié)約的成本

使用LLM是按照回復(fù)的token數(shù)量付費(fèi)的，因此讓LLM的回答簡(jiǎn)明扼要可以節(jié)約成本。

在提示詞中加入“Be Concise”（答案簡(jiǎn)明些），可以節(jié)約40-90%的成本。

1.3：每個(gè)單詞的平均token數(shù)

LLM是對(duì)token進(jìn)行操作的，token可能包含完整單詞或其中的一部分。

如“eating”是由“eat”和后綴“ing”兩個(gè)token組成。

一篇750詞的英文文章中大約含有1000個(gè)token。

而對(duì)于其他語言，每個(gè)詞所含的token數(shù)量可能更多。

價(jià)格

價(jià)格數(shù)據(jù)會(huì)存在波動(dòng)，本節(jié)的價(jià)格數(shù)據(jù)主要參考OpenAI，但其他公司數(shù)據(jù)也相似。

約50倍：GPT-4與GPT-3.5花費(fèi)的比值

效果上，GPT-4的表現(xiàn)明顯好于GPT-3.5，但其成本約為后者的50倍之多。

因此，對(duì)于諸如總結(jié)這類GPT-3.5也能出色完成的任務(wù)，可以考慮不使用更昂貴的GPT-4。

5倍：GPT-3.5-Turbo生成與使用OpenAI embedding的成本比

諸如“美國(guó)的首都是哪里”這類可以通過檢索得到答案的問題，讓LLM生成答案的成本是檢索的5倍。

而如果使用GPT-4，成本差異將高達(dá)250倍。

10倍：OpenAI embedding與自建embedding的成本比

這一數(shù)字為大約數(shù)值，實(shí)際情況可能隨著embedding的規(guī)模而變化。

6倍：微調(diào)版與基本版OpenAI模型的成本比值

盡管成本較為昂貴，但對(duì)基本OpenAI模型的微調(diào)是有意義的。

對(duì)基本模型進(jìn)行微調(diào)的效益明顯高于定制模型。

1倍：自建模型是否進(jìn)行微調(diào)的成本比

由于參數(shù)量相同，是否進(jìn)行微調(diào)對(duì)自建模型的成本幾乎沒有影響。

訓(xùn)練與微調(diào)

約100萬美元：在1.4萬億token上訓(xùn)練130億參數(shù)模型的成本

這一數(shù)字是建立在一切工作都十分順利、沒有發(fā)生崩潰的前提下計(jì)算出的。

Meta的大語言模型LLaMA的論文當(dāng)中顯示，用2048塊80GB A100 GPU進(jìn)行訓(xùn)練LLaMA一共花費(fèi)了21天。

<0.001：微調(diào)與從頭開始訓(xùn)練的成本比

這一數(shù)據(jù)有一些籠統(tǒng)，但微調(diào)的成本幾乎可以忽略不計(jì)。

對(duì)一個(gè)60億參數(shù)模型進(jìn)行微調(diào)的成本大約是7美元。

即使是最貴的OpenAI模型Davinci，1000個(gè)token的微調(diào)成本也只有3美分。

相對(duì)于對(duì)一部莎士比亞全集進(jìn)行微調(diào)也只需要40美元。

GPU消耗

如果你要自建模型，了解其GPU消耗十分重要。

本節(jié)所列數(shù)據(jù)僅是推理過程所消耗的資源量，訓(xùn)練和微調(diào)過程還需要更多資源。

V100: 16GB, A10G: 24GB, A100: 40/80GB：GPU內(nèi)存大小

GPU內(nèi)存大小決定了LLM的參數(shù)量上限。

24GB的A10G在亞馬遜云服務(wù)中的價(jià)格為1.5-2美元每小時(shí)。

參數(shù)量的2倍：LLM的典型GPU內(nèi)存需求

例如，7B參數(shù)量的LLM需要消耗14GB的GPU內(nèi)存。

這是因?yàn)榇蠖鄶?shù)時(shí)候，每個(gè)參數(shù)需要16bit浮點(diǎn)空間。

通常情況下不需要使用超過16bit的精度，8bit則會(huì)顯著降低結(jié)果精準(zhǔn)度。

約1GB：嵌入式模型的典型GPU內(nèi)存需求

嵌入式模型消耗的本地GPU資源是很小的。

甚至可以在一塊GPU上同時(shí)運(yùn)行多個(gè)嵌入式模型。

超過10倍：批量處理LLM請(qǐng)求帶來的吞吐量改善

在GPU上運(yùn)行LLM時(shí)往往會(huì)有較大延遲。

一次請(qǐng)求消耗的時(shí)間可能長(zhǎng)達(dá)5秒，相對(duì)于每秒僅能處理0.2個(gè)。

但如果同時(shí)發(fā)送兩個(gè)請(qǐng)求，消耗的時(shí)間約為5.2秒。

而將25個(gè)請(qǐng)求捆綁發(fā)出的耗時(shí)約為10秒，相對(duì)于每秒可處理2.5個(gè)請(qǐng)求。

約1MB：130億參數(shù)模型輸出1個(gè)token所需的GPU內(nèi)存

內(nèi)存消耗量與生成token數(shù)成正比。

512個(gè)token（約380個(gè)英文單詞）需要消耗512MB的空間。

作者簡(jiǎn)介

這篇文章的作者來自開源人工智能框架Ray的開發(fā)公司Anyscale。

主要貢獻(xiàn)者是Google前首席工程師Waleed Kadous。

他也曾擔(dān)任Uber CTO辦公室工程戰(zhàn)略負(fù)責(zé)人。

其中一位華人合作者是Google前員工Huaiwei Sun。

他來自江蘇昆山，本科畢業(yè)于上海交通大學(xué)工業(yè)設(shè)計(jì)專業(yè)。

期間，他參加了耶魯大學(xué)summer school并取得了滿績(jī)。

此后他取得了佐治亞理工學(xué)院碩士學(xué)位，研究方向?yàn)槿藱C(jī)交互。

此外還有其他作者也參與了這篇文章的工作，未來也可能有更多人加入。

參考鏈接：[1]https://github.com/ray-project/llm-numbers[2]https://www.linkedin.com/in/scottsun94/

標(biāo)簽：

責(zé)任編輯：FD31

上一篇：行政合同糾紛應(yīng)通過什么途徑解決？哪些合同屬于行政合同？

下一篇：最后一頁

精彩圖集(熱圖)

熱點(diǎn)圖集

實(shí)踐中對(duì)收養(yǎng)人能否收養(yǎng)成年子女有幾種意見？收養(yǎng)人能否收養(yǎng)成年子女？

點(diǎn)擊詳細(xì)
女子舉重是從什么時(shí)候開始的？舉重減肥的優(yōu)勢(shì)是什么？

點(diǎn)擊詳細(xì)
股票期權(quán)如何開通？股票期權(quán)開通要具備什么條件？

點(diǎn)擊詳細(xì)
2023年中秋國(guó)慶假期如何放假調(diào)休？中秋國(guó)慶假期高速免費(fèi)嗎?

點(diǎn)擊詳細(xì)
勞動(dòng)合同到期辭職了可以領(lǐng)失業(yè)金嗎？領(lǐng)取失業(yè)金要滿足什么條件？

點(diǎn)擊詳細(xì)
聚焦高分劇《漫長(zhǎng)的季節(jié)》專家：走出類型局限環(huán)球動(dòng)態(tài)

點(diǎn)擊詳細(xì)
iqoo產(chǎn)品經(jīng)理宋紫薇個(gè)人資料宋紫薇高清寫真

點(diǎn)擊詳細(xì)
行政合同糾紛應(yīng)通過什么途徑解決？哪些合同屬于行政合同？

點(diǎn)擊詳細(xì)
中國(guó)旅游日，跟著李白、杜甫、徐霞客去旅行

點(diǎn)擊詳細(xì)
焦點(diǎn)消息！88只股中線走穩(wěn) 站上半年線

點(diǎn)擊詳細(xì)
會(huì)計(jì)初級(jí)職稱好考嗎？會(huì)計(jì)初級(jí)職稱報(bào)名條件和要求？

點(diǎn)擊詳細(xì)
大模型開發(fā)者必備手冊(cè)：這些數(shù)字值得記住

點(diǎn)擊詳細(xì)
金線蓮的功效與作用是什么？金線蓮怎么栽培？

點(diǎn)擊詳細(xì)
指揮家邵恩執(zhí)棒40載：指揮的成功緊緊地拴在樂隊(duì)身上

點(diǎn)擊詳細(xì)
什么是保理合同糾紛？保理合同糾紛如何解決？

點(diǎn)擊詳細(xì)
化妝棉怎么清洗才干凈？常用的化妝工具怎么清洗？

點(diǎn)擊詳細(xì)
匯正財(cái)經(jīng)為什么拉人?匯正老學(xué)員來聊聊自身所學(xué)

點(diǎn)擊詳細(xì)
乳液和面霜的區(qū)別是什么？補(bǔ)水乳液的主要功效是什么？

點(diǎn)擊詳細(xì)

最近更新

大模型開發(fā)者必備手冊(cè)：這些數(shù)字值得記住

點(diǎn)擊詳細(xì)
實(shí)踐中對(duì)收養(yǎng)人能否收養(yǎng)成年子女有幾種意見？收養(yǎng)人能否收養(yǎng)成年子女？

點(diǎn)擊詳細(xì)
股票期權(quán)如何開通？股票期權(quán)開通要具備什么條件？

點(diǎn)擊詳細(xì)
辦理收養(yǎng)登記的事實(shí)收養(yǎng)情況有幾種？關(guān)于收養(yǎng)孩子入戶條件有哪些規(guī)定？

點(diǎn)擊詳細(xì)
女子舉重是從什么時(shí)候開始的？舉重減肥的優(yōu)勢(shì)是什么？

點(diǎn)擊詳細(xì)
化妝棉怎么清洗才干凈？常用的化妝工具怎么清洗？

點(diǎn)擊詳細(xì)
收養(yǎng)孩子有哪些要求？如何收養(yǎng)孩子？

點(diǎn)擊詳細(xì)
打新基金四步驟是什么?基金暫停贖回風(fēng)險(xiǎn)大嗎？

點(diǎn)擊詳細(xì)
勞動(dòng)合同到期辭職了可以領(lǐng)失業(yè)金嗎？領(lǐng)取失業(yè)金要滿足什么條件？

點(diǎn)擊詳細(xì)
蘑菇發(fā)霉了還能不能吃？蘑菇放的時(shí)間長(zhǎng)了長(zhǎng)白毛能吃嗎？

點(diǎn)擊詳細(xì)
夏季如何調(diào)養(yǎng)脾胃？調(diào)理脾胃的養(yǎng)生粥有哪些？

點(diǎn)擊詳細(xì)
中國(guó)旅游日，跟著李白、杜甫、徐霞客去旅行

點(diǎn)擊詳細(xì)
當(dāng)前快報(bào):作家莫言為書法“拋磚引玉” 愿更多年輕人“重拾”毛筆

點(diǎn)擊詳細(xì)
聚焦高分劇《漫長(zhǎng)的季節(jié)》專家：走出類型局限環(huán)球動(dòng)態(tài)

點(diǎn)擊詳細(xì)
【盤中播報(bào)】45只個(gè)股跨越牛熊分界線

點(diǎn)擊詳細(xì)
指揮家邵恩執(zhí)棒40載：指揮的成功緊緊地拴在樂隊(duì)身上

點(diǎn)擊詳細(xì)
焦點(diǎn)消息！88只股中線走穩(wěn) 站上半年線

點(diǎn)擊詳細(xì)
今日盤中突破五日均線個(gè)股一覽

點(diǎn)擊詳細(xì)
福建上杭首次發(fā)現(xiàn)恐龍蛋已進(jìn)行搶救性保護(hù)

點(diǎn)擊詳細(xì)
【熱聞】【盤中播報(bào)】滬指跌0.36% 石油石化行業(yè)跌幅最大

點(diǎn)擊詳細(xì)
基金5月18日參與7家公司的調(diào)研活動(dòng)

點(diǎn)擊詳細(xì)
超過60歲還能協(xié)商網(wǎng)貸延期嗎？網(wǎng)貸延期怎么協(xié)商效果好？

點(diǎn)擊詳細(xì)
2023年中秋國(guó)慶假期如何放假調(diào)休？中秋國(guó)慶假期高速免費(fèi)嗎?

點(diǎn)擊詳細(xì)
乳液和面霜的區(qū)別是什么？補(bǔ)水乳液的主要功效是什么？

點(diǎn)擊詳細(xì)
金線蓮的功效與作用是什么？金線蓮怎么栽培？

點(diǎn)擊詳細(xì)
iqoo產(chǎn)品經(jīng)理宋紫薇個(gè)人資料宋紫薇高清寫真

點(diǎn)擊詳細(xì)
房貸延期辦理有年齡限制嗎？房貸延期哪些人可以申請(qǐng)？

點(diǎn)擊詳細(xì)
一側(cè)臉疼是三叉神經(jīng)痛嗎？半邊臉刺痛是怎么回事？

點(diǎn)擊詳細(xì)
西安銀行信用卡額度一般多少？西安信用卡還款日寬限期

點(diǎn)擊詳細(xì)
沒學(xué)位證能考公務(wù)員考試嗎？國(guó)家承認(rèn)的五種學(xué)歷提升方式

點(diǎn)擊詳細(xì)

熱詞榜

編輯推薦

精彩圖集

專題策劃

美團(tuán)“取關(guān)”支付寶外賣付款方式要變了？

信用中國(guó)

信用信息
行政許可和行政處罰
網(wǎng)站文章

瀏覽排行

<del id="2m2ia"></del>