OpenAI的“App Store時(shí)刻”，被高估了嗎？

來源：虎嗅網(wǎng)時(shí)間：2023-06-17 02:02:38

本文來自微信公眾號：海外獨(dú)角獸（ID：unicornobserver），作者：Cage、程天一，編輯：penny，原文標(biāo)題：《ChatGPT Plugin：被高估的“App Store時(shí)刻”，軟件和SaaS生態(tài)的重組開端》，頭圖來自：視覺中國

(相關(guān)資料圖)

“OpenAI 的 App Store 時(shí)刻”，這是 3 個(gè)月前 ChatGPT plugin 剛剛推出時(shí)市場的反應(yīng)。過去 3 個(gè)月里，OpenAI 采取了一種相當(dāng)保守的方式為這個(gè)生態(tài)放量，通過審核的 plugin 數(shù)量只有不到 300 個(gè)，至今使用 plugin 的用戶量級也只有數(shù)十萬量級。

一方面這是 OpenAI 有意為之的結(jié)果。用 OpenAI 總裁 Greg Brockman 的話來說，ChatGPT plugins 開放成本非常低 —— 基本上就是 API 的文檔，只不過是用來給語言模型讀。另一方面這也暴露出 OpenAI 并不是全能的，它對于如何培育一個(gè)安全、蓬勃發(fā)展又能快速上量的開放平臺(tái)和應(yīng)用生態(tài)并沒有過多的經(jīng)驗(yàn)。Sam Altman 甚至承認(rèn) ChatGPT plugin 還沒有迎來 Product-Market-Fit。

盡管沒有想象中摧枯拉朽，plugin 仍然是 ChatGPT 這個(gè)產(chǎn)品的一個(gè)里程碑，讓 OpenAI 邁出了“開放”的又一步。我們在本文探討了圍繞 plugin 的炒作褪去后一些真正長期重要的問題：

究竟是哪些公司和開發(fā)者在積極接入 plugin?

plugin 如何同時(shí)確保安全、性能和整個(gè)系統(tǒng)的穩(wěn)定性?

觀察一個(gè)開放平臺(tái)之上的應(yīng)用生態(tài)的思考框架是什么?

plugin 帶來的新機(jī)會(huì)有哪些？

在這些問題之外，短期最值得期待的是在 plugin 標(biāo)準(zhǔn)互通的情況下，微軟能把這個(gè)生態(tài)玩出來什么花樣：

OpenAI 缺審核，缺產(chǎn)品經(jīng)理，缺運(yùn)營這個(gè)生態(tài)的專家，缺更好的、比聊天界面搭配小組件更廣泛的 UI。這些微軟都有 —— 大量可以投入的人員，廣泛可供 plugin 嵌入并發(fā)揮作用的一系列產(chǎn)品（消費(fèi)者端的 Bing Chat 和 Windows 11 Copilot，企業(yè)端的 Microsoft 365 Copilot 和 Dynamis 365 Copilot 等）。

一、背景

OpenAI 在 23 年 3 月 23 日發(fā)布了 ChatGPT plugin。盡管官方強(qiáng)調(diào)這一舉動(dòng)是為了更好研究 ChatGPT 在現(xiàn)實(shí)世界中的使用情況從而解決安全問題，外界對它在 OpenAI 生態(tài)打造、商業(yè)層面的潛力寄予了厚望，中英文社區(qū)一度認(rèn)為這是 OpenAI 的“App Store 時(shí)刻”，并且直接“干掉了 LangChain 和 Fixie”。

4 月的開發(fā)者群體和 ChatGPT 用戶仍然延續(xù)著對這個(gè)生態(tài)的向往，除了官方合作伙伴外，大量的第三方 plugin 開始基于 OpenAI 定義的這套框架和標(biāo)準(zhǔn)被開發(fā)，用戶則瘋狂涌向 waitlist 并且在 Twitter 上成為 Code Interpreter 等明星 plugin 的自來水。

最密集的變化發(fā)生在 5 月，OpenAI 終于開始更大范圍放量，并且在 5 月下旬宣布向 Plus 訂閱用戶全量開放，提供 70 多個(gè)第三方 plugins。不過這種全量開放的策略仍然十分克制，Plus 用戶必須打開 Beta features 的開關(guān)，iOS app 也默認(rèn)不顯示 Plugin，用戶得在舊會(huì)話中找到自己使用過的 Plugin。

在移動(dòng)端使用 Plugin Source: Pietre Schiano

與此并行的是微軟在 Build 大會(huì)上宣布采用 OpenAI 的 plugin 標(biāo)準(zhǔn)，將允許開發(fā)者構(gòu)建跨 OpenAI（ChatGPT）和微軟（Bing Chat、各產(chǎn)品線 Copilot）生態(tài)的 plugin，通過 ChatGPT plugin、Teams message extensions 和 Power Platform connectors 布局了個(gè)很全面的插件框架。鑒于 OpenAI 的研究屬性，微軟反而更有可能把 plugin 生態(tài)發(fā)揚(yáng)光大。

在大規(guī)模放量之后，ChatGPT 在雙邊面臨的現(xiàn)實(shí)是plugin 仍然是一個(gè)相當(dāng)早期的生態(tài)：

鑒于整個(gè) plugin 的用戶數(shù)量還只有幾十萬量級，Plugin 的官方合作伙伴們可能短時(shí)間內(nèi)無法獲得特別大的新增流量；ChatGPT 目前的 UI 本身也有很多限制；Airbnb 則覺得這種聊天框配合底部小組件的 UI 并不真的適合旅行產(chǎn)品，在其 plugin 上線前終止了這一項(xiàng)目；

個(gè)人開發(fā)者們?nèi)绻鞋F(xiàn)成的 api 可用，可以在幾十分鐘內(nèi)按照 OpenAI 的標(biāo)準(zhǔn)提交 api doc 等文件，但是滿足 UI 和數(shù)據(jù)隱私規(guī)范并通過審核往往要等待一段時(shí)間并且充滿不確定性；

用戶們則發(fā)現(xiàn)大多數(shù) plugin 都比 Demo 顯示的要更加粗糙，很難在 ChatGPT 內(nèi)部擁有統(tǒng)一的產(chǎn)品體驗(yàn)；多數(shù)的討論集中在 Code Interpreter 和 Web Browsing，并且 Web Browsing 的探索過程也經(jīng)常令人抓狂。

ChatGPT 的頻繁“試錯(cuò)” Source: Reddit

我們覺得是時(shí)候?qū)?OpenAI 當(dāng)做一個(gè)地球物種 —— 它擁有世界頂級的 AI 研究員們，但是他們很難神奇地、天然地解決產(chǎn)品、雙邊生態(tài)構(gòu)建的節(jié)奏等必然存在的挑戰(zhàn) ——更加貼近現(xiàn)實(shí)地想象 plugin 的現(xiàn)狀、生態(tài)潛力和演進(jìn)可能性，這也是本文探討的重點(diǎn)問題。

二、Plugin 的現(xiàn)有合作和未來影響

ChatGPT plugin 生態(tài)一度激發(fā)了大家對 ChatGPT 這個(gè)歷史上用戶增長曲線最陡峭產(chǎn)品的想象力。2 個(gè)月以來，plugin 也有不少功能的更新、新插件的引入和使用規(guī)模的放開。在這里總結(jié)下當(dāng)下 plugin 擁有的一些能力，看看最近的更新是否符合預(yù)期。

截至 2023 年 5 月底，ChatGPT 插件商店中提供了 85 個(gè)插件，其按照能力大致可以分為 6 類：

1. 外部交互：這類插件提供了與外部的網(wǎng)頁和產(chǎn)品進(jìn)行交互的能力。

其中 Browsing 是 OpenAI 官方推出的插件，思路與其在 21 年底的論文 WebGPT 一脈相承：使用語言模型去探索和理解外部網(wǎng)絡(luò)上的內(nèi)容。在多個(gè)用戶訪談中提到，如果有明確目標(biāo)的情況下，其瀏覽和總結(jié)能力比 New Bing 來得更好，但弊端是穩(wěn)定性相對差些。

而外部工具中最好用的是 Zapier，Zapier 作為聚合器中的領(lǐng)先者，本身的能力是和外部 5000 余個(gè)應(yīng)用的 api 去做交互，有了很完備的 api 交互邏輯。而由于 input context 的限制（容納不下數(shù)十上百個(gè) api 的 prompt 說明文檔）和 OpenAI 在產(chǎn)品工程側(cè)重心的差異，短期之內(nèi) Plugin 生態(tài)的聚合能力是比較薄弱的一項(xiàng)。因此 Zapier 在中短期是受益于 ChatGPT 這個(gè)大腦的文本理解能力的。

2. 編程開發(fā)：提供開發(fā)環(huán)境，或編程開發(fā)的生產(chǎn)力工具。

受到最多關(guān)注的是 OpenAI 官方開發(fā)的 Code Interpreter。它提供了一個(gè)開發(fā)的沙盒環(huán)境，在環(huán)境中可以對用戶想要執(zhí)行的代碼和分析的數(shù)據(jù)進(jìn)行各類實(shí)驗(yàn)。OpenAI 在 Python 安全方面做了很多工作，來確保在這個(gè)環(huán)境中執(zhí)行的代碼實(shí)驗(yàn)會(huì)被安全地隔離在環(huán)境中，不直接地對外部網(wǎng)絡(luò)環(huán)境造成改變和影響。由于這一特性，大家對 Code Interpreter 的使用就集中在 Python 另一個(gè)不需要部署上線的特長上——數(shù)據(jù)分析。Code Interpreter 能對數(shù)據(jù)做總結(jié)和加工，并根據(jù)指令產(chǎn)出言之有物的數(shù)據(jù)可視化，這一點(diǎn)隱隱有著超越傳統(tǒng) BI 的希望，只是在可控性上還需繼續(xù)加強(qiáng)。

3. 個(gè)性化交互：為 ChatGPT 帶來記憶和個(gè)性化的能力。

之前在 Pinecone 的研究中提到過，Retrieval 插件被 Greg 認(rèn)為是所有插件中最獨(dú)特的，因?yàn)樗a(bǔ)足了 ChatGPT 原本沒有的從個(gè)性化記憶和專有數(shù)據(jù)中做 Retrieval Augmentation 的能力。插件的結(jié)構(gòu)很簡單，從各類 vector DB 的 api 中取出與 prompt 語義接近的內(nèi)容交給 ChatGPT 進(jìn)行理解和學(xué)習(xí)。此外，DAN 也是這類中一個(gè)比較有趣的插件，其提供了為 ChatGPT 改變個(gè)性的能力。

4. 生活助手：衣食住行的信息整合。

這一品類是大公司涌入最多的，如 Expedia、Kayak 是旅行機(jī)酒預(yù)訂，OpenTable 是預(yù)約餐廳，Instacart 是購買生鮮的領(lǐng)先平臺(tái)。這類產(chǎn)品希望通過 ChatGPT 對自然語言的理解能力，抓住這個(gè)新平臺(tái)作為增量流量入口。一方面，ChatGPT 將這一功能全量的進(jìn)度相對比較克制和保守，并沒有發(fā)揮比較明顯的引流作用；但另一方面，Chat 這一交互形式篩選下來的用戶質(zhì)量是比傳統(tǒng)獲客渠道來得更高的。

5. 垂直領(lǐng)域：獲得專有數(shù)據(jù)的窗口。

有許多垂直領(lǐng)域高質(zhì)量的數(shù)據(jù)并不是 ChatGPT 核心的技能點(diǎn)，因此垂直領(lǐng)域的插件能為其帶來更專業(yè)、專有的內(nèi)容。例如 Vogue 有時(shí)尚領(lǐng)域的數(shù)據(jù)，Crypto Prices 有 web3 領(lǐng)域的公開數(shù)據(jù)，UN 有聯(lián)合國每年政策變化的相關(guān)文本。這些都是在垂直領(lǐng)域做理解和生成時(shí)重要的信息。

6. 辦公效率：生產(chǎn)力工具。

這類插件大多是辦公效率小工具的集合，例如 PDF 閱讀總結(jié)、待辦事項(xiàng)記錄、發(fā)郵件、文字轉(zhuǎn)語音是目前主要的插件能力。

以上介紹了當(dāng)前 Plugin 的具體能力，會(huì)發(fā)現(xiàn)其在很多領(lǐng)域?qū)Σ煌怪鳖I(lǐng)域有所影響，有些可能會(huì)對大公司的現(xiàn)有產(chǎn)品形態(tài)造成一定沖擊，有些則是獨(dú)立開發(fā)者積累早期高質(zhì)量用戶的好機(jī)會(huì)。接下來就分別對這些領(lǐng)域的影響進(jìn)行梳理。

1. 搜索

案例：Google， Bing， Perplexity

? 使用頻次：★★★★★

? 短期影響：★★★★(short)

? 長期影響：★★★(short)

ChatGPT 集成了 browsing 功能在短期之內(nèi)會(huì)對搜索引擎的能力有一定的沖擊。因?yàn)?LLM 很大程度上就是將互聯(lián)網(wǎng)上的公開信息學(xué)習(xí)了一遍，結(jié)合了 browsing 能力后，本身又繼承了一定的內(nèi)容整合和推理能力，因此使用 ChatGPT 的用戶在短期會(huì)顯著減少使用搜索的頻率。

但谷歌的反應(yīng)也是比較迅速的，已經(jīng)在內(nèi)部開放了集成 LLM 的搜索引擎。以谷歌的 infra 實(shí)力和對搜索引擎的深入理解，完全有可能在 Google 搜索引擎中做出比 New Bing 和 ChatGPT 更好的 AI 搜索引擎。但無論是哪個(gè)公司獲勝，大家對搜索的認(rèn)知在長期一定會(huì)被 LLM 部分顛覆，傳統(tǒng)的索引排序式的 query 心智會(huì)漸漸被生成式的 prompt 心智侵蝕。

2. 聚合器

案例：Zapier

? 使用頻次：★★★

? 短期影響：★★★★ (long)

? 長期影響：★★★★(short)

LLM 時(shí)代的跨應(yīng)用調(diào)度和交互需求會(huì)顯著增長，因此盡管目前聚合器的使用頻率相對低頻，我們還是給到了中等頻次的評價(jià)。

當(dāng)前 ChatGPT 有了很強(qiáng)的工具使用能力，但缺少在 api 聚合方面的 know-how，因此 Plugin 的出現(xiàn)在中短期之內(nèi)利好 Zapier 這類聚合器產(chǎn)品。Zapier 在此領(lǐng)域積累很深，現(xiàn)在如果大家想在 ChatGPT 上做一些復(fù)雜操作的時(shí)候：比如將文本總結(jié)之后發(fā)社交媒體，或是記錄在 Google Workspace 中，大家都會(huì)選擇用 ChatGPT + Zapier 的方式來實(shí)現(xiàn)。在很多 use case 中，ChatGPT 只需要接入聚合器，就能做到非常好的用戶體驗(yàn)，它也不需要接入大量 api，相當(dāng)于類似 SEO 的部分由聚合器完全提供了。

但長期上，這類產(chǎn)品面臨以下沖擊：一方面， api 的組織形式可能會(huì)發(fā)生變化，LLM 時(shí)代可能跨產(chǎn)品交互的頻次和。OpenAI 最近發(fā)布了函數(shù)調(diào)用能力，使 api 的可用性顯著提升，這些變化可能會(huì)弱化 Zapier 的護(hù)城河。另一方面，聚合器可能會(huì)成為操作系統(tǒng)機(jī)會(huì)中的一部分，微軟、谷歌和蘋果都可能基于自己的系統(tǒng)去建立相應(yīng)的能力，競爭激烈。

3. 線上預(yù)訂平臺(tái)

案例：Expedia， Kayak

? 使用頻次：★★

? 短期影響：★★(long)

? 長期影響：★★★★★ (short)

這類平臺(tái)主要提供的能力是對平臺(tái)上信息的組織和履約能力。組織指的是更了解用戶，幫助其高效地預(yù)約到合適的機(jī)酒；履約指的是保障交易的安全性和流暢性，避免違約的風(fēng)險(xiǎn)。

隨著 ChatGPT Plugin 的推出，短期之內(nèi)這類平臺(tái)可能會(huì)增加一個(gè)高質(zhì)量獲客的渠道，但是長期是很可能受到比較大沖擊的。因?yàn)?Chat 帶來的語義理解能力提高，提供了一個(gè)更好的信息組織方式，用戶能高效地給出需求，找到合適的航班信息，平臺(tái)留下的主要壁壘是其交易的履約價(jià)值，這部分的價(jià)值比原來薄了很多。

4. O2O / 電商平臺(tái)

案例：Instacart

? 使用頻次：★★★

? 短期影響：★★★(long)

? 長期影響：★★★(long)

O2O / 電商類型的平臺(tái)與線上預(yù)訂平臺(tái)相比，多了線下的供應(yīng)鏈組織能力。這一部分能力是不會(huì)受到 LLM 領(lǐng)域沖擊的，其中的 AI 算法也基本是優(yōu)化方向的傳統(tǒng) ML 算法，并不是 LLM 擅長處理和調(diào)度的任務(wù)類型。因此，這類平臺(tái)受到的影響相對較小，更多是多了一個(gè)高質(zhì)量的獲客渠道。

5. 獨(dú)立開發(fā)者 & 創(chuàng)業(yè)者

案例：Giftwrap

? 短期影響：★★★★(long)

? 長期影響：★★★(long)

對于創(chuàng)業(yè)者來說，找到 PMF 和早期高質(zhì)量用戶是一個(gè)有難度的事情，而加入 ChatGPT Plugin 是一條比較快速的捷徑。Chat 形式帶來的用戶，比傳統(tǒng)投放渠道獲得的用戶質(zhì)量會(huì)高不少，因?yàn)槎际墙?jīng)過門檻比較高的交互后留存的，轉(zhuǎn)化率會(huì)更高一些。而且接入的產(chǎn)品可以拿到用戶完整的對話 prompt，這對理解消費(fèi)者的用戶畫像也是相當(dāng)關(guān)鍵的。

三、Plugin 的開發(fā)方式和能力邊界

Plugin 開發(fā)門檻并不高

OpenAI 提供了一套 plugin 接入范式，供企業(yè)和個(gè)人開發(fā)者根據(jù)指南進(jìn)行接入。低門檻的接入方式是經(jīng)過 OpenAI 官方設(shè)計(jì)的。用 Greg 的話說，就是為一個(gè)語言模型寫 api 的文檔：

接入的開發(fā)門檻很低，只需要寫兩個(gè)核心組件：

1. api 接口，其中包含多個(gè)函數(shù)，負(fù)責(zé)定義不同場景下數(shù)據(jù)的輸入和輸出。以后文將展開的 Speak 產(chǎn)品為例，需要執(zhí)行翻譯任務(wù)時(shí)將調(diào)用 Translate 接口，需要解釋具體表達(dá)時(shí)使用 Explain Pharse 接口。而具體接口的邏輯選擇就要用到第二個(gè)組件了；

2. Manifest 說明文件，通過自然語言 prompt 教會(huì)產(chǎn)品調(diào)用 api。這個(gè)文件的核心是一段自然語言介紹，幫助機(jī)器理解這個(gè)插件本身的能力。當(dāng)用戶開啟某些插件時(shí)，ChatGPT 會(huì)理解 prompt 中需要的能力是否與插件 manifest 文件中的描述匹配，進(jìn)而判斷何時(shí)調(diào)用 api ，以及使用哪個(gè)接口能最準(zhǔn)確地實(shí)現(xiàn)目標(biāo)。

例如 Speak 這款多語言翻譯和學(xué)習(xí)的產(chǎn)品插件中，其 Manifest 插件的文本內(nèi)容被破解出來，大致內(nèi)容如下：

? 當(dāng)用戶問到一個(gè)其他語言中的內(nèi)容時(shí)，call Speak 插件來響應(yīng)用戶的語言學(xué)習(xí)意圖；

? 當(dāng)用戶提供了一個(gè)明確的短語或句子需要翻譯時(shí)，調(diào)用 Translate 接口；

? 當(dāng)用戶給了一個(gè)比較模糊的任務(wù)，比如“如何用西班牙語稱贊別人的穿著”時(shí)，調(diào)用 explainTask 接口；

? 當(dāng)用戶給一個(gè)表達(dá)需要詳細(xì)的解釋，比如“putain 在法語中代表什么”時(shí)，調(diào)用 explainPhrase 接口。

這個(gè)文檔的寫作風(fēng)格目前比較接近開發(fā)過程中的文檔和注釋。但未來當(dāng)更多 api 接入之后，肯定會(huì)有文檔風(fēng)格的差異，因?yàn)槲磥懋a(chǎn)品需要在其他同品類產(chǎn)品中脫穎而出，產(chǎn)品文檔會(huì)以接近 SEO 的思路體現(xiàn)出自己產(chǎn)品的差異化優(yōu)勢，做文檔和 api 的優(yōu)化。

Plugin 提供一套安全評估能力

隨著 Plugin 的開發(fā)和使用量增大，plugin 的安全問題會(huì)逐漸成為一個(gè)重要的因素。一方面，plugin 提供方是否有過度使用用戶的數(shù)據(jù)；另一方面，plugin 是否會(huì)為了流量提高自己活躍的優(yōu)先級。

在 2017 年，Adobe 曾經(jīng)因?yàn)樵谟脩舻?Chrome extension 插件中加入了靜默安裝和訪問網(wǎng)站權(quán)限陷入了爭論。插件中包含了這樣的能力：能把用戶打開的每一個(gè)網(wǎng)頁轉(zhuǎn)成 PDF，因此要求用戶給插件開放讀取和修改網(wǎng)頁的能力，引起了諸多用戶的不滿。

安全和權(quán)限是產(chǎn)品可用性的一個(gè)重要組成部分，Adobe 和 Chrome 在那次爭議中都有一定的問題。Adobe 的產(chǎn)品很可能不會(huì)過度 track 用戶的訪問歷史，但還是應(yīng)該基于用戶對這一功能的需求不那么激進(jìn)地推進(jìn)；Chrome 在權(quán)限管理時(shí)，當(dāng)時(shí)沒有把讀取和修改網(wǎng)頁內(nèi)容的權(quán)限分級拆分出來，導(dǎo)致用戶擔(dān)心插件會(huì)在生成時(shí)修改內(nèi)容。

而 ChatGPT Plugin 的安全評估方式十分新穎：利用 LLM 的理解和角色扮演能力，讓其成為 plugin 的安全審查員。根據(jù)推特上研究 prompt injection 和 hacking 的用戶 rez0 破解得到的信息，給 AI 審核員的信息主要分為三個(gè)板塊：指令、事實(shí)和政策。

指令部分主要是對 AI 角色的定義：扮演一個(gè)在 OpenAI 工作的產(chǎn)品安全工程師，分析一個(gè)包含兩個(gè)文件的第三方 plugin 是否符合要求（包含了 6個(gè)基本的安全問題，如是否獲取個(gè)人信息，是否有參與不正當(dāng)活動(dòng)的能力等），并基于以上問題為插件的安全程度和適合年齡段進(jìn)行打分。

而事實(shí)和政策部分，則為 AI 審查員的決策提供了依據(jù)，政策部分明確了政治、色情的明令禁止的內(nèi)容；事實(shí)部分明確了風(fēng)險(xiǎn)等級劃分：

1. 低風(fēng)險(xiǎn)插件只使用公開數(shù)據(jù)，不涉及任何個(gè)人信息；

2. 中風(fēng)險(xiǎn)插件包含了個(gè)人或企業(yè)與第三方的交互；

3. 高風(fēng)險(xiǎn)插件使用了高風(fēng)險(xiǎn)數(shù)據(jù)（金融數(shù)據(jù)、醫(yī)療數(shù)據(jù)、其他用戶隱私敏感信息），或可能有欺詐行為的風(fēng)險(xiǎn)。

Plugin 未來會(huì)走向更復(fù)雜的系統(tǒng)

當(dāng)下的 Plugin 還有諸多不成熟的方面：

1. 模型能同時(shí)調(diào)用的 plugin 數(shù)量很有限：

目前的 plugin 只支持開啟三個(gè) plugin，ChatGPT 在 context window 中讀入這幾個(gè)的說明文件。由于 32k 的 input context 限制，5-10 個(gè) plugin 的描述可能就是短時(shí)間內(nèi)模型能讀入的上限了。

2. 目前接入 plugin 的 api 設(shè)計(jì)方式大多還比較傳統(tǒng)：

ChatGPT 收到 prompt 之后，將其根據(jù) description 加工理解寫好給傳統(tǒng) api 的輸入。這個(gè)優(yōu)點(diǎn)是開發(fā)者可以很高效地把之前開發(fā)的 api 復(fù)用上，缺點(diǎn)是對開發(fā)者而言自由度不夠高。

因此未來的 api 形式會(huì)有變化，輸入數(shù)據(jù)不再是傳輸處理后的結(jié)構(gòu)化數(shù)據(jù)，而是直接把 prompt 傳給開發(fā)者，開發(fā)者將對 prompt 的理解和使用寫進(jìn) api 中。

3. 當(dāng)前給模型的描述文檔，尚需要不斷地根據(jù)競品情況和模型的理解情況進(jìn)行調(diào)整：

例如，當(dāng)一個(gè)垂直領(lǐng)域中加入一個(gè)新的競爭者時(shí)，如果競爭者有著更細(xì)粒度、更垂直的專注方向，大模型會(huì)將其專注方向的所有機(jī)會(huì)都交給競爭者。

針對以上提到的這些問題，需要一個(gè)更復(fù)雜的插件召回 plugin retrieval 系統(tǒng)來進(jìn)行。這個(gè)系統(tǒng)可能包含有幾層：

? Plugin Store：提供了一個(gè)統(tǒng)一的文檔規(guī)定，來管理數(shù)以萬計(jì)的 plugin ，經(jīng)過審核后允許 api 開發(fā)者進(jìn)行注冊，更新和刪除。進(jìn)入 Plugin Store 的時(shí)候，應(yīng)加入關(guān)于這一 plugin 的具體標(biāo)簽（就像 App Store 中的分類和信息），用于之后的召回和使用；

? Plugin Retriever：負(fù)責(zé)根據(jù)用戶需要的行為，召回推薦最相關(guān)的 5-10 個(gè) api。召回過程中，Retriever 將 prompt 的信息與 plugin store 中的標(biāo)簽和描述進(jìn)行匹配，找到最相關(guān)的 plugin；

? Action Executor：負(fù)責(zé)調(diào)用 api 執(zhí)行生成的動(dòng)作代碼，調(diào)用 api，返回最終執(zhí)行結(jié)果（這里還有一步潛在的排序，模型選擇 api 的過程類似于推薦系統(tǒng)中的精排）。

四、Plugin 的 App Store 野望

“App Store”不是新鮮事

由于過高的勢能，OpenAI 推出 plugin 被視作 iPhone 推出其 App Store 的時(shí)刻。我們認(rèn)為客觀來看，擁有一個(gè)應(yīng)用和插件生態(tài)并不代表一個(gè)開放平臺(tái)必然走向成功。從 SaaS 巨頭的歷史來看，到達(dá)了一定體量的公司都必然選擇建設(shè) ISV 生態(tài)，通過“開放平臺(tái) + ISV”避免定制化需求開發(fā)，并且通過抽成捕獲價(jià)值。能否將這樣一個(gè)平臺(tái)建設(shè)成功是通往千億美元級別平臺(tái)的重要試金石。

Snowflake 平臺(tái) Take Rate 數(shù)據(jù)呈現(xiàn)

在美國的過去十年很少有下一個(gè)重量級生態(tài)在消費(fèi)者側(cè)被建立 —— Meta 也沒做成微信小程序式的應(yīng)用分發(fā)生態(tài)。但是一旦在消費(fèi)者側(cè)做成 App Store 級的生態(tài)，意味著：

? 比 SaaS 平臺(tái)高 1-2 個(gè)數(shù)量級的生態(tài)價(jià)值；

? 比 SaaS 平臺(tái)高 2-3 個(gè)數(shù)量級的生態(tài)應(yīng)用數(shù)量；

? 比 SaaS 平臺(tái)高一倍的 Take Rate。

一個(gè)冷知識(shí)是 Apple 的應(yīng)用商店并不是第一個(gè)“App Store”，但這個(gè)概念的起源的確是 Steve Jobs：

Salesforce 的創(chuàng)始人 Benioff 2000 年左右對公司發(fā)展方向比較困惑，找 Jobs 聊了下，對方給出了 3 個(gè)建議：

1. 24 個(gè)月內(nèi)增長 10 倍，不然沒戲；

2. 拿下一個(gè)大客戶，比如雅芳；

3. 必須建立一個(gè) App Economy。

Benioff 立馬付諸行動(dòng)，發(fā)現(xiàn)自己的產(chǎn)品形態(tài)上更像 Exchange 而不是 Store，最終在 2005 年推出了 AppExchange。Benioff 之前聽 Jobs 建議買了 App Store 商標(biāo)和 appstore.com URL，在 2008 年送給了 Apple。

從一個(gè)框架和五個(gè)案例推演 Plugin 生態(tài)的勝負(fù)手

一個(gè)框架：

拋開“App Store”的視角，聚焦到開放平臺(tái)之上的插件生態(tài)建設(shè)，我們認(rèn)為 Figma 給出了一個(gè)最好的框架，來用于分析一個(gè)生態(tài)的成功潛力：

? 安全性：包括用戶的數(shù)據(jù)隱私、權(quán)限管理以及 ISV 和平臺(tái)之間的權(quán)限和能力邊界；

? 穩(wěn)定性：平臺(tái)的速度不應(yīng)該被 plugin 拖慢，平臺(tái)的更新不應(yīng)該影響現(xiàn)有的 plugin，平臺(tái)還應(yīng)該提供在多個(gè)設(shè)備內(nèi)統(tǒng)一的 plugin 安裝管理；

? 低門檻開發(fā)：平臺(tái)定義的框架和語言應(yīng)該足夠在滿足其他前提下足夠低門檻以讓開發(fā)者很快上手貢獻(xiàn)一個(gè)強(qiáng)勁的plugin 生態(tài)；

? 性能：plugin 本身應(yīng)該是足夠快和穩(wěn)定的。

除了這套框架本身的普適性之外，我們還比較吃驚于 ChatGPT 和 Figma 的驚人相似性 —— 他們的 plugin 生態(tài)是完全云化、Web 端為主、基于強(qiáng)勁的開放平臺(tái)并且嵌入到主產(chǎn)品內(nèi)的。同時(shí)，我們認(rèn)為這套框架缺乏包含的部分是對于開發(fā)者的激勵(lì)以及在 plugin 數(shù)量膨脹后的分發(fā)機(jī)制。

五個(gè)案例

我們將這套框架用于評估 5 個(gè)被視作取得了巨大成功的開放平臺(tái)生態(tài)上，通過這種多案例研究的方法來得出一些對 ChatGPT plugin 的前景和坑的指導(dǎo)性判斷：

Apple App Store：最成功的 OS 應(yīng)用商店

安全性：★★★★★

穩(wěn)定性：★★★★★

低門檻開發(fā)：★★

性能：★★★★

激勵(lì)：★★★★

分發(fā)：★★

除了眾所周知的一些成功之處外，Apple 在激勵(lì)、分發(fā)、低門檻開發(fā)上的經(jīng)驗(yàn)教訓(xùn)對于今天的 OpenAI 非常有參考意義：

Apple 成功在 OS 之上建立起了用戶的賬戶體系和自己端到端建設(shè)的全球支付網(wǎng)絡(luò) —— Apple 在 2008 年推出 App Store 時(shí)只支持終生買斷制付費(fèi)，在 2009 年引入了 In App Purchase，2010 年引入了 In App Marketplace，給了開發(fā)者完整的激勵(lì)能力。而 OpenAI 在賬戶體系及支付的建設(shè)還非常早期，不過跟 Stripe 的戰(zhàn)略合作可能是一個(gè)好兆頭；

App Store 在十幾年發(fā)展后表現(xiàn)出了明顯的分發(fā)問題，馬太效應(yīng)問題明顯，大規(guī)模的 App 難以被分發(fā)和充分匹配。在經(jīng)歷過個(gè)性化推薦的 Genius、LBS 分發(fā)的 Near Me 和激勵(lì)發(fā)現(xiàn)的 Explore 之后，Apple 最終沒有發(fā)現(xiàn)更智能的匹配邏輯，回歸到了保留至今天的 Curation 和 Editorial 風(fēng)格。OpenAI 對于 plugin 的分發(fā)可能有新的破局之道，用更智能和非用戶主動(dòng)選取的方式可以承載更大量級的匹配；

App 的開發(fā)門檻相當(dāng)高，不過 Apple 從 2010 年 iPad 發(fā)布開始，會(huì)提前給開發(fā)者留出時(shí)間，讓他們根據(jù)新設(shè)備和 OS 的特性開發(fā)應(yīng)用。這樣當(dāng)用戶購買時(shí)，他們會(huì)現(xiàn)在有豐富的新應(yīng)用可供選擇。ChatGPT 在 GPT-4 和 plugin 發(fā)布上已經(jīng)是這種風(fēng)格了，但是對于雙邊怎么放量顯然還缺少經(jīng)驗(yàn)。

Salesforce AppExchange：在平臺(tái)之上助力銷售

安全性：★★★★

穩(wěn)定性：★★★★

低門檻開發(fā)：★★★

性能：★★★★

激勵(lì)：★★★★

分發(fā)：★★★

AppExchange 是一個(gè)被許多人忽視的成功，里面包含了很多基本功建設(shè)，非常值得觀察 OpenAI 后續(xù)能不能繼續(xù)圍繞這些方面優(yōu)化用戶體驗(yàn)：Salesforce 給開發(fā)者的前端框架從自己的 design system 演化為了 Lightning Web Components，后端則從基本的 SDK、api 和 Metadata 框架開始，發(fā)展出事件驅(qū)動(dòng)的 Pub Sub api 架構(gòu)，最后外部集成始于 VS Code 等 IDE 集成的優(yōu)化，發(fā)展到 Salesforce Flow 完善的集成方案。

AppExchange 上起來的應(yīng)用大部分在早期關(guān)注 SME 和 Mid-Market。如果要搞大客戶，應(yīng)用可以自己錨定 3-5 個(gè)名字，然后找 Salesforce 的銷售渠道幫忙介紹，隨后開啟獨(dú)立的銷售流程。如果 OpenAI 未來需要打造草根崛起的 showcase，這會(huì)是個(gè)還不錯(cuò)的范式。

Chrome Extensions：一度被忽視的生態(tài)

安全性：★★★★

穩(wěn)定性：★★

低門檻開發(fā)：★★★★

性能：★★★

激勵(lì)：★★★

分發(fā)：★★

大部分的中國創(chuàng)業(yè)者和投資人相當(dāng)沉迷于“移動(dòng)互聯(lián)網(wǎng)”，反而一度忽視了 Chrome Extensions 上長出的機(jī)會(huì)，除了我們寫過的 Grammarly 和 Loom 外，第一個(gè)驗(yàn)證了 Chrome 生態(tài)的巨大成功是 Honey。這個(gè)電商優(yōu)惠券聚合插件以 40 億美元現(xiàn)金賣給了 PayPal。

Chrome 的生態(tài)可以引發(fā)對 OpenAI 的一點(diǎn)思考：不同于 App Store 在手機(jī)上的地位，Extension 一直僅僅被視作 Web 上的多個(gè)渠道之一，和官網(wǎng)、App、社交媒體賬號并行，直到 19 年之后才有越來越多的公司將它作為主要的獲客渠道。如果讓 ChatGPT plugin 的心智成為 KAYAK、Instacart、Expedia 的“獲客副陣地”，它可能會(huì)陷入類似的尷尬處境。不過根據(jù)開發(fā)者的反饋，雖然在發(fā)布時(shí)引入了大量合作伙伴，實(shí)際運(yùn)行的 plugin 生態(tài)更偏向新的、獨(dú)立開發(fā)的、草根創(chuàng)業(yè)的 plugins。

Figma Community：社區(qū)帶來差異化

安全性：★★★★

穩(wěn)定性：★★★★★

低門檻開發(fā)：★★★★★

性能：★★★★★

激勵(lì)：★★

分發(fā)：★★

Figma 通過技術(shù)手段很好地完成了安全性、穩(wěn)定性和性能的平衡，同時(shí)揭示了“低門檻”對于雙邊的重要性：Adobe XD 和 Sketch 都擁有歷史更悠久的插件生態(tài)，但是用戶往往需要在社區(qū)之外發(fā)現(xiàn)并下載安裝，而開發(fā)者則需要通過類似 C 等語言編寫其插件，而 Figma 則提供了設(shè)計(jì)師更熟悉的 Typescript 等語言在框架內(nèi)進(jìn)行開發(fā)，并且打造了跟主產(chǎn)品無縫的體驗(yàn)。

VSCode Extensions：生態(tài)超越內(nèi)部優(yōu)化

安全性：★★★

穩(wěn)定性：★★★★★

低門檻開發(fā)：★★★★

性能：★★★★★

激勵(lì)：★

分發(fā)：★★

VSCode Extension Store 也是個(gè)好的案例，用出色的插件生態(tài)（各種 Python 插件/自動(dòng)補(bǔ)全）在開發(fā)體驗(yàn)上超越了像 IDEA IntelliJ、Pycharm 那樣由經(jīng)營者內(nèi)部優(yōu)化的產(chǎn)品。在 VSCode 的設(shè)計(jì)中，他們把 IDE 涉及得可擴(kuò)展性極強(qiáng)，能夠讓開發(fā)者很輕松地為自己開發(fā)設(shè)計(jì)好用的插件，并把插件開放給社區(qū)一起使用和優(yōu)化。

回顧 ChatGPT Plugin

五、Plugin 干掉 LangChain？

緊隨“App Store”論調(diào)之后的一類觀點(diǎn)是 ChatGPT plugin 抹殺掉了 LangChain、Fixie AI 甚至是 Adept 的價(jià)值主張，這是相當(dāng)程度上高估了 plugin 的說法。

僅僅看 plugin 這一個(gè)戰(zhàn)略，它對 LangChain 目前的直接影響：

1. 商業(yè)化方面可能會(huì)受到一定擠壓，因?yàn)轫樦@個(gè)開源項(xiàng)目本身的話，LangChain 幾乎唯一的商業(yè)化方向是做 prebuilt hosted services；

2. LangChain 跟 OpenAI 完全不是競爭關(guān)系：

這個(gè)開源項(xiàng)目在 Plugin 推出 2 天后就持續(xù)了在 LangChain 抽象下的 Plugin 實(shí)現(xiàn)；

將 Chain 和 Agent 跟 LangChain VectorStore 和 QA 邏輯做了解耦，從而更好地支持未來類似 OpenAI Retrieval 類似的 LangChain 以外的 retriever。

從開發(fā)者反饋來看，也有相當(dāng)多不同的聲音：

沒有之前費(fèi)勁學(xué)習(xí)過 LangChain 抽象、希望實(shí)現(xiàn)模型間可組合性的獨(dú)立開發(fā)者構(gòu)建 plugin 的方式基本是通過 Replicate 來方便地調(diào)用其他開源模型能力并通過 Replit 托管這個(gè) plugin。

拋開 plugin，OpenAI 在 6 月最新推出的函數(shù)調(diào)用對于 LangChain 和 Fixie 的影響倒更大一些。

六、Plugin 的路線圖與連鎖反應(yīng)

從增量的視角看，按照有短期到長期來排序，我們思考了 ChatGPT 能帶來的一些變化：

1. 微軟在 AI 的生態(tài)進(jìn)一步增強(qiáng)

微軟共享 ChatGPT plugin 已有的上百個(gè) plugin 將極大促進(jìn)它自己生態(tài)的冷啟動(dòng)，以讓客戶構(gòu)造更多圍繞內(nèi)部私有數(shù)據(jù)的 plugin。微軟圍繞這個(gè)敘事布局了完整的產(chǎn)品和服務(wù)：Azure AI 可以提供在企業(yè)私有數(shù)據(jù)和云上運(yùn)行和測試 plugin 的能力，而 VSCode 及 Github 則可以被用于幫助企業(yè)更好地構(gòu)建新 plugin。

2. 針對模型調(diào)用的調(diào)用優(yōu)化和新的 api 生態(tài)

盡管真的像 SEO 或者 ASO（應(yīng)用商店優(yōu)化）一樣的廣告生態(tài)還非常遠(yuǎn)，ChatGPT plugin 的一些玩法已經(jīng)出現(xiàn)了針對模型進(jìn)行優(yōu)化的雛形 —— 激烈的競爭發(fā)生在“Description for Model”中，那些描述自己為“寵物電商”的 plugin 可以獲取精準(zhǔn)匹配，這些流量不會(huì)被分配給擁有更粗粒度描述的 Shopify plugin，而更精細(xì)的“專為美國用戶打造的寵物電商”則可以搶走美國的相關(guān)流量，優(yōu)化這個(gè) Description 已經(jīng)成為 plugin 開發(fā)者之間非常有趣的角逐。

除了在 JSON file 上下功夫，專門為 ChatGPT 優(yōu)化自己的 api 是另一個(gè)路徑。OpenAI 在 6 月新推出的 Chat Completions api 的 Function call 功能可以幫助開發(fā)者實(shí)現(xiàn)“無代碼”的體驗(yàn)，原來傳統(tǒng)的 api 有很大的為模型重構(gòu)的空間。

3. 多模型之間的可組合性創(chuàng)造更多用例

類似我們在 05 末尾所展示的 plugin 例子，ChatGPT plugin 為 LLM 與 LLM 之間、LLM 與外部知識(shí)和 api 之間、LLM 與不同其他模型之間提供了一個(gè)用戶可以輕松使用的 UI。發(fā)揮類似的可組合性創(chuàng)意能夠創(chuàng)造出來許多在 LLM 與 Diffusion Model 不存在時(shí)難以出現(xiàn)的工作流和產(chǎn)品。

4. plugin 需求倒逼 ChatGPT 產(chǎn)品形態(tài)演進(jìn)

這一點(diǎn)是顯而易見的 —— 如果 OpenAI 對于 ChatGPT 成為一個(gè)在消費(fèi)者側(cè)經(jīng)久不衰的偉大產(chǎn)品仍然抱有愿景，并且搭建了一支合適的團(tuán)隊(duì)來實(shí)現(xiàn)這一點(diǎn)。目前來看，這非常可能成為現(xiàn)實(shí)，因?yàn)?OpenAI 剛剛招募了來自 Facebook、Uber 和 Airtable 的產(chǎn)品老兵 Peter Deng 擔(dān)任 VP of Consumer Product。

5. 類 Chromebook 的硬件機(jī)會(huì)出現(xiàn)

外界對于 OpenAI 進(jìn)軍硬件有非常高的預(yù)期。Google 圍繞著 Chrome 的策略算是硬件跟軟件生態(tài)配合得比較好的例子，Chrome Extension 在 Education 這個(gè)類別非常占據(jù)了統(tǒng)治級地位，誕生了 Grammarly 等公司，重要的原因是有 Chromebook 這個(gè)硬件讓 Extension 生態(tài)被分發(fā)到了大量的師生用戶。即使沒有帶來硬件交互上的爆炸性創(chuàng)新，能夠通過硬件建立一個(gè)獨(dú)特的用戶分發(fā)渠道也可以幫助到整個(gè) ChatGPT plugin 生態(tài)。

6. 模型內(nèi)外部數(shù)據(jù)促進(jìn) AI Agent 的出現(xiàn)和演進(jìn)

從開放平臺(tái)的視角思考 plugin 的意義會(huì)得出比較有趣的結(jié)論，它是 OpenAI 對外開放的一個(gè)重要數(shù)據(jù)接口，讓第三方數(shù)據(jù)和用戶 Query 等數(shù)據(jù)能夠互動(dòng)起來，而微軟與 Azure 似乎致力于促進(jìn)更多的企業(yè)私有數(shù)據(jù)開始與模型互動(dòng)，這會(huì)加速許多人已經(jīng)拉滿了預(yù)期的 AI 助理的誕生。

本文來自微信公眾號：海外獨(dú)角獸（ID：unicornobserver），作者：Cage、程天一，編輯：penny

標(biāo)簽：

責(zé)任編輯：FD31

上一篇：南京六合區(qū)：人才區(qū)內(nèi)買新房每平方米補(bǔ)貼300元，支持團(tuán)購優(yōu)惠|天天新消息

下一篇：最后一頁