久久久久精品一区二区三区不卡_2020国产精品午夜视频_下载91香蕉视频_丁香婷婷在线观看_日韩在线中文字幕av

一村資本研究社|硅軀慧心:人工智能的具身覺(jué)醒之路

來(lái)源:今日熱點(diǎn)網(wǎng)時(shí)間:2024-12-07 19:11:49

一村淞靈專注于早中期投資,致力于構(gòu)建一個(gè)強(qiáng)大的AI生態(tài)朋友圈。AI與具身智能的結(jié)合一直是行業(yè)領(lǐng)域研究和探索的重要方向。本篇文章作為《航海日志》系列的延續(xù),結(jié)合探討了具身智能可能存在的表現(xiàn)形式,探索AI與具身智能在現(xiàn)實(shí)世界相互融合演進(jìn)的可能性。

從圖靈測(cè)試到深度學(xué)習(xí),從專家系統(tǒng)到大語(yǔ)言模型,AI的每一次進(jìn)化都在拓展著人類對(duì)智能的理解邊界。AI與具身智能的結(jié)合,一直是行業(yè)領(lǐng)域研究探索的重要方向。

上篇文章《航海日志|慧智硅基靈巧手》我們點(diǎn)明,“所有模型算法將下沉到具身智能這個(gè)“大殺器”中,具身智能能讓軟硬件、AI、外部環(huán)境(包括人文環(huán)境)‘同頻共振’! ”。今日,我們便與大家共同探索AI與具身智能的“雙生之旅”。

在人工智能發(fā)展的漫長(zhǎng)河流中,我們見(jiàn)證了從簡(jiǎn)單的計(jì)算到復(fù)雜的認(rèn)知系統(tǒng)的演變。如今,一個(gè)新的篇章正在開(kāi)啟——具身智能(Embodied AI)的崛起。這不僅是技術(shù)的進(jìn)步,更是人工智能向著真正"智能"邁進(jìn)的重要一步。機(jī)器人,作為具身智能最重要、最復(fù)雜的載體,一直是我們深度探索的核心。讓我們踏上這段探索之旅,一起揭開(kāi)其中的神秘面紗。

01、從虛擬走向現(xiàn)實(shí):具身智能的誕生

想象一下,如果給予ChatGPT一個(gè)機(jī)器人身體,讓它不只能與我們對(duì)話,還能實(shí)際行動(dòng),會(huì)發(fā)生什么?這就是具身智能要探索的領(lǐng)域。具身智能不再滿足于在虛擬世界中運(yùn)算和思考,而是要通過(guò)物理實(shí)體與現(xiàn)實(shí)世界直接互動(dòng)。就像嬰兒需要通過(guò)觸摸、抓握、行走來(lái)認(rèn)識(shí)世界一樣,AI也需要一個(gè)"身體"來(lái)真正理解和適應(yīng)這個(gè)立體的世界。

具身智能的概念源于認(rèn)知科學(xué)的一個(gè)基本觀點(diǎn):智能的產(chǎn)生離不開(kāi)身體的參與。人類的智能發(fā)展就是一個(gè)很好的例證。我們的認(rèn)知能力不是與生俱來(lái)的,而是在與環(huán)境的持續(xù)互動(dòng)中逐步形成,同理,具身智能技術(shù)演進(jìn)的一個(gè)重要邏輯就是基于大模型在現(xiàn)實(shí)環(huán)境下的高泛化性(需要應(yīng)對(duì)從未見(jiàn)過(guò)的場(chǎng)景)以及思維鏈能力(需要拆解復(fù)雜任務(wù)以及根據(jù)環(huán)境變化調(diào)整動(dòng)作)。如幼兒通過(guò)抓、摔、摸等各種方式探索物體,在這個(gè)過(guò)程中建立起對(duì)物理世界的基本認(rèn)知,而具身智能作為“新物種”參與到我們客觀物理世界,也需要經(jīng)過(guò)物體感知(視覺(jué)感知、觸覺(jué)感知、數(shù)據(jù)感知) 、 腦部認(rèn)知(語(yǔ)義分析、運(yùn)動(dòng)控制、多模態(tài)基礎(chǔ)模型)、行動(dòng)范式(智能交互、任務(wù)規(guī)劃、具身執(zhí)行)的持續(xù)迭代升級(jí)。

感知之門:具身智能的眼與手

如果說(shuō)傳統(tǒng)AI系統(tǒng)是"淺嘗即止"的數(shù)字隱者,那么具身智能則是要讓AI真正"走出象牙塔"的物理探索者。這場(chǎng)突破始于感知系統(tǒng)的革新,它賦予了AI前所未有的感知維度。

視覺(jué)感知,具身智能的"火眼金睛"。它不僅配備了能捕捉細(xì)膩色彩的高清相機(jī),還裝備了能夠洞察深度的3D傳感器。激光雷達(dá)就像其"第三只眼",能夠在黑暗中繪制精確的環(huán)境地圖。這些視覺(jué)系統(tǒng)相互配合,讓AI能夠比人類看得更遠(yuǎn)、更清、更全面。

視覺(jué)語(yǔ)言模型生成的結(jié)果到機(jī)器人動(dòng)作的映射方式,主要取決于該預(yù)測(cè)結(jié)果的層級(jí)。之前模型中預(yù)測(cè)結(jié)果處于高級(jí)別設(shè)計(jì)層級(jí):以Google PaLM-E和微軟ChatGPT for Robotics為例,PaLM-E實(shí)現(xiàn)了對(duì)具身任務(wù)的決策方案預(yù)測(cè),但不涉及機(jī)器人動(dòng)作的實(shí)際控制,需要依賴低級(jí)別的現(xiàn)成策略或規(guī)劃器來(lái)將決策方案“翻譯 ”為機(jī)器人動(dòng)作。微軟默認(rèn)提供控制機(jī)器人的低層級(jí)API,ChatGPT輸出是更高層級(jí)的代碼,需調(diào)用到機(jī)器人低層級(jí)的庫(kù)或API,從而實(shí)現(xiàn)對(duì)機(jī)器人動(dòng)作的映射和控制。RT-2和VoxPoser預(yù)測(cè)結(jié)果已經(jīng)到了低級(jí)別動(dòng)作層級(jí),不需要再經(jīng)過(guò)復(fù)雜的翻譯即可將高層級(jí)設(shè)計(jì)映射到低層級(jí)動(dòng)作。

視覺(jué)感知的三個(gè)關(guān)鍵領(lǐng)域包括:視覺(jué)SLAM、3D場(chǎng)景理解、主動(dòng)探索:

VSLAM & SLAM技術(shù)已在智能汽車、消費(fèi)級(jí)機(jī)器人(配送機(jī)器人、掃地機(jī)器人等)等領(lǐng)域靈活運(yùn)用,是一項(xiàng)發(fā)展較為成熟的技術(shù)。

3D場(chǎng)景理解:視覺(jué)領(lǐng)域的發(fā)展路徑,不僅是在點(diǎn)云算法的結(jié)構(gòu)布置及技術(shù)成熟,更是在生成的3D場(chǎng)景上的深度理解,并基于視覺(jué)信息預(yù)測(cè)和執(zhí)行復(fù)雜任務(wù)。

因此,(1)要求模型具備快速將2D平面圖轉(zhuǎn)化為3D結(jié)構(gòu)的生成能力。(2)要求模型需要具備理解物體的基本屬性及事態(tài)發(fā)展的時(shí)序變化(x、y、z、t四維空間)。

除了視覺(jué)感知之外,我們關(guān)注觸覺(jué)感知系統(tǒng)。通過(guò)遍布"身體"各處的壓力傳感器和觸覺(jué)傳感器,具身智能系統(tǒng)能夠感受到與物體接觸時(shí)的力度、紋理和溫度。這種觸覺(jué)反饋對(duì)于精確操作至關(guān)重要,就像人類需要通過(guò)手指的觸覺(jué)來(lái)判斷抓握的力度一樣。

在上篇文章《慧智硅基靈巧手》中我們也提到,我們關(guān)注GELSIGHT這種視觸覺(jué)傳感器的不斷演進(jìn)發(fā)展,“視覺(jué)”+“觸覺(jué)”的構(gòu)造原理使它能夠與深度學(xué)習(xí)算法融合,相比于其他觸覺(jué)感知方式,其能夠完成更為精細(xì)化的操作,我們認(rèn)為它將會(huì)是未來(lái)機(jī)器人靈巧手上的“珍珠”。

02、智慧之源:具身智能的腦部模型

感知系統(tǒng)收集的信息需要經(jīng)過(guò)腦部模型的處理才能轉(zhuǎn)化為智能行為。腦部模型就像一個(gè)精密的指揮中心,需要同時(shí)處理多個(gè)層面的問(wèn)題。LLM、VLM(視覺(jué)語(yǔ)言模型)等基礎(chǔ)模型的最新進(jìn)展,特別是ChatGPT、PaLM等模型在具身智能中的應(yīng)用,有效增強(qiáng)了其感知和決策能力,推動(dòng)大模型成為具身智能實(shí)現(xiàn)“感知-推理-預(yù)測(cè)-行動(dòng)”能力的主流架構(gòu),業(yè)界已經(jīng)有多款模型發(fā)布,并在各類復(fù)雜任務(wù)中取得了顯著的進(jìn)展,且這些模型仍在快速迭代與優(yōu)化中,例如RT-1、RT-2、RT-H、PaLM-E、VoxPoser等,點(diǎn)亮了機(jī)器人的慧能。

RT-2/VoxPoser的一大突破是使機(jī)器人可以理解自然語(yǔ)言指令,無(wú)需復(fù)雜的編程語(yǔ)言便可完成人機(jī)交互。RT-2模型建立在視覺(jué)-語(yǔ)言模型(VLM)的基礎(chǔ)上,賦予機(jī)器人語(yǔ)義理解和基本推理能力,使其可以聽(tīng)懂并自主推理出已滅絕動(dòng)物(恐龍)和哪種飲料最適合疲憊的人(能量飲料);李飛飛團(tuán)隊(duì)VoxPoser模型只需接收到“打開(kāi)上面的抽屜,小心花瓶!”類似的指令即可執(zhí)行任務(wù);在前華為天才少年彭志輝創(chuàng)業(yè)公司智元機(jī)器人所發(fā)布的視頻中,機(jī)器人也可根據(jù)簡(jiǎn)單的文字或語(yǔ)音指令對(duì)桌面上不同顏色的方塊進(jìn)行選取、調(diào)位和疊放等操作。

無(wú)需訓(xùn)練即可完成復(fù)雜指令且產(chǎn)生涌現(xiàn)能力,未知場(chǎng)景下RT-2模型泛化能力翻倍。 新模型的另一大突破是無(wú)需預(yù)定義的運(yùn)動(dòng)原語(yǔ)或額外的數(shù)據(jù)和訓(xùn)練,模型泛化能力增強(qiáng),加速機(jī)器人通用化。過(guò)去算法下實(shí)現(xiàn)機(jī)器人扔垃圾的動(dòng)作需訓(xùn)練機(jī)器人區(qū)分、撿起、扔掉垃圾 各個(gè)步驟, 而RT-2可以將網(wǎng)絡(luò)相關(guān)知識(shí)傳給機(jī)器人,使其無(wú)需明確的訓(xùn)練即可學(xué)會(huì)扔垃圾。面對(duì)之前從未見(jiàn)過(guò)的任務(wù)情形,RT-2成功率達(dá)到62%,泛化性能較RT-1提高一倍。

而VoxPoser用大模型指導(dǎo)機(jī)器人如何與環(huán)境進(jìn)行交互,達(dá)到在無(wú)需額外數(shù)據(jù)和訓(xùn)練的情況下完成各種任務(wù),并且涌現(xiàn)出了4種行為能力,可以自主分步完成任務(wù),掌握評(píng)估方法,根據(jù)最新要求做出判斷進(jìn)而調(diào)整輸出動(dòng)作。

腦部模型有三大重要任務(wù)

1. 環(huán)境理解:模型需要將各種感知信息整合起來(lái),構(gòu)建對(duì)當(dāng)前場(chǎng)景的完整認(rèn)知。比如,在搬運(yùn)物體時(shí),需要同時(shí)考慮物體的形狀、重量、材質(zhì)等特性,以及周圍環(huán)境的空間布局。

RT-2泛化能力還體現(xiàn)在其思維鏈(CoT)助其進(jìn)行多階段語(yǔ)義推理,完成更復(fù)雜任務(wù)。DeepMind研究團(tuán)隊(duì)展示了將思維鏈推理納入RT-2中使其能夠進(jìn)行多階段語(yǔ)義推理,他們用少量的“增強(qiáng)”數(shù)據(jù)微調(diào)一個(gè)RT-2-PaLM-E變種,增強(qiáng)數(shù)據(jù)中加入了“Plan”步驟, 使得VLM首先用自然語(yǔ)言描述機(jī)器人將要采取的動(dòng)作的目的,然后再給出預(yù)測(cè)的機(jī)器人動(dòng)作標(biāo)記。通過(guò)實(shí)驗(yàn)結(jié)果可以觀察到,具有思維鏈推理的RT-2能夠回答更復(fù)雜的命令。

2. 任務(wù)規(guī)劃:模型需要根據(jù)目標(biāo)制定詳細(xì)的執(zhí)行計(jì)劃。這個(gè)過(guò)程涉及到語(yǔ)義解析、路徑規(guī)劃、動(dòng)作序列生成等多個(gè)環(huán)節(jié)。比如,要拿起桌子上的水杯,系統(tǒng)需要規(guī)劃手臂的移動(dòng)軌跡,考慮避開(kāi)障礙物,并設(shè)計(jì)合適的抓取姿態(tài)及動(dòng)作代碼。

RT-2動(dòng)作控制采用的方法是將機(jī)器人動(dòng)作表示為另一種語(yǔ)言,即文本token,并與Web規(guī)模的視覺(jué)-語(yǔ)言數(shù)據(jù)集一起訓(xùn)練。代表機(jī)器人動(dòng)作的文本字符串可以是機(jī)器人動(dòng)作token編號(hào)的序列,例如「1 128 91 241 5 101 127 217」,該字符串以一個(gè)標(biāo)志開(kāi)始,該標(biāo)志指示機(jī)器人是繼續(xù)還是終止當(dāng)前情節(jié),然后機(jī)器人根據(jù)指示改變末端執(zhí)行器的位置和旋轉(zhuǎn)以及機(jī)器人抓手等命令。由于動(dòng)作被表示為文本字符串,因此機(jī)器人執(zhí)行動(dòng)作命令就像執(zhí)行字符串命令一樣簡(jiǎn)單。這種表示方式允許谷歌對(duì)現(xiàn)有的視覺(jué)-語(yǔ)言模型進(jìn)行微調(diào),并將其轉(zhuǎn)換為視覺(jué)-語(yǔ)言-動(dòng)作模型。

Voxposer的動(dòng)作控制實(shí)現(xiàn)過(guò)程是首先給定環(huán)境信息(用相機(jī)采集RGB-D圖像)和自然語(yǔ)言指令,之后LLM(大語(yǔ)言模型)根據(jù)這些內(nèi)容編寫(xiě)代碼,所生成代碼與VLM(視覺(jué)語(yǔ)言模型)進(jìn)行交互,指導(dǎo)系統(tǒng)生成相應(yīng)的操作指示地圖(3D Value Map),之后動(dòng)作規(guī)劃器將生成的3D地圖作為目標(biāo)函數(shù),直接合成最終操作軌跡。在用LLM和VLM將語(yǔ)言指令映射為3D地圖的過(guò)程中,系統(tǒng)利用“感興趣的實(shí)體(entity of interest)”來(lái)引導(dǎo)機(jī)器人進(jìn)行操作,也就是通過(guò)3D Value Map中標(biāo)記的值來(lái)反應(yīng)哪個(gè)物體是對(duì)它具有“吸引力”的,哪些物體是具有“排斥性”,比如在打開(kāi)抽屜的例子中,抽屜就是“吸引”的,花瓶是“排斥”的。

3. 實(shí)時(shí)調(diào)整:在執(zhí)行過(guò)程中,系統(tǒng)需要根據(jù)反饋不斷優(yōu)化行為。就像人類在提起一個(gè)未知重量的物體時(shí)會(huì)根據(jù)觸覺(jué)反饋調(diào)整施力一樣,具身智能系統(tǒng)也需要這種動(dòng)態(tài)適應(yīng)能力。

目前基于具身智能腦部大模型的技術(shù)路線還遠(yuǎn)未開(kāi)始收斂,隨著后續(xù)各類大模型的持續(xù)發(fā)展,具身智能底層架構(gòu)同樣有變化的可能。

03、SIM 2 REAL:具身智能的“修羅場(chǎng)”

在具身智能的進(jìn)化之路上,SIM2REAL(從仿真到現(xiàn)實(shí))技術(shù)扮演著獨(dú)特的"道場(chǎng)"角色。想象一個(gè)可以隨心所欲重啟的平行宇宙,這里不存在硬件損耗,不需要擔(dān)心安全風(fēng)險(xiǎn),每一次嘗試都是成長(zhǎng)的養(yǎng)分。通過(guò)構(gòu)建高度逼真的三維仿真環(huán)境,系統(tǒng)能夠精確模擬物理規(guī)律、材料特性和環(huán)境變化。

國(guó)內(nèi)已有優(yōu)秀的團(tuán)隊(duì)在進(jìn)行虛擬訓(xùn)練場(chǎng)的搭建與集成,即空間快速構(gòu)建3D場(chǎng)景,提供物理正確的仿真環(huán)境,并快速低成本生成3D合成數(shù)據(jù)。他們基于OpenUSD,無(wú)縫連接各種DCC、CAD、CAE,通過(guò)實(shí)時(shí)協(xié)作提升現(xiàn)有工作流的協(xié)作效率,提高沉淀在各個(gè)工具上的3D資產(chǎn)的流動(dòng)性。通過(guò)低成本現(xiàn)有方案組合AIGC應(yīng)用,提升3D場(chǎng)景構(gòu)建效率,包括2D生3D、大語(yǔ)言模型交互生成3D場(chǎng)景等。

在這個(gè)虛擬訓(xùn)練場(chǎng)中,一臺(tái)機(jī)器人可以同時(shí)化身成千上百個(gè)分身,并行訓(xùn)練不同的技能。比如,一個(gè)抓取任務(wù)可以在不同的光照條件、不同的物體位置、不同的干擾因素下反復(fù)練習(xí)。這種訓(xùn)練方式的效率遠(yuǎn)超現(xiàn)實(shí)世界,幾小時(shí)的仿真訓(xùn)練可能相當(dāng)于現(xiàn)實(shí)世界中數(shù)月的練習(xí)。

然而,從仿真環(huán)境遷移到現(xiàn)實(shí)世界并非易事。這就像職業(yè)選手在電子游戲中再厲害,到了真實(shí)賽場(chǎng)也需要重新適應(yīng)。仿真環(huán)境永遠(yuǎn)無(wú)法完美復(fù)制現(xiàn)實(shí)世界的所有細(xì)節(jié),這種差異被稱為"現(xiàn)實(shí)鴻溝"(Reality Gap)。為了解決這個(gè)問(wèn)題,研究者們開(kāi)發(fā)了一系列創(chuàng)新方法。域隨機(jī)化(Domain Randomization)就是其中最有效的策略之一。這種方法通過(guò)在仿真環(huán)境中隨機(jī)改變物理參數(shù)、視覺(jué)外觀、環(huán)境條件等要素,迫使系統(tǒng)學(xué)習(xí)更加魯棒的策略。

這里不可避免的要提到機(jī)器人的運(yùn)控系統(tǒng),運(yùn)動(dòng)控制系統(tǒng)主要通過(guò)控制關(guān)節(jié)電機(jī)的扭矩以實(shí)現(xiàn)行走、奔跑、跳躍、搬箱子等與運(yùn)動(dòng)有關(guān)的任務(wù)。這種運(yùn)動(dòng)控制系統(tǒng),通俗來(lái)說(shuō),可以被稱為“小腦”。目前的機(jī)器人運(yùn)動(dòng)控制系統(tǒng),需要針對(duì)不同型號(hào)的機(jī)器人進(jìn)行適配,完成適配之后的量產(chǎn),則可以批量化復(fù)制。基于深度強(qiáng)化學(xué)習(xí)方案的運(yùn)控效果在魯棒性上一般遠(yuǎn)超基于傳統(tǒng)控制的方案,主要體現(xiàn)在:抗沖擊性更強(qiáng)、運(yùn)動(dòng)速度更快、復(fù)雜地形適應(yīng)性更強(qiáng)。

從研究和體會(huì)來(lái)說(shuō),基于強(qiáng)化學(xué)習(xí)尋找的最優(yōu)路徑屬于無(wú)監(jiān)督,拓展能力較強(qiáng),因此含金量也體現(xiàn)在其他多型機(jī)器的運(yùn)控兼容及穩(wěn)定方面。

想象一下,如果要訓(xùn)練一個(gè)機(jī)器人抓取咖啡杯,仿真系統(tǒng)會(huì)隨機(jī)改變杯子的大小、重量、材質(zhì),甚至添加各種干擾因素。經(jīng)過(guò)這種"大風(fēng)大浪"的訓(xùn)練、系統(tǒng)學(xué)到的策略以及機(jī)器人不斷精進(jìn)的運(yùn)控系統(tǒng)就能更好地適應(yīng)現(xiàn)實(shí)世界的變化。

同時(shí),通過(guò)混合現(xiàn)實(shí)訓(xùn)練,將虛擬環(huán)境和真實(shí)環(huán)境結(jié)合起來(lái),也大大提高了訓(xùn)練效果。

總體而言,Sim 2 Real技術(shù)通過(guò)使用合成數(shù)據(jù)來(lái)模擬真實(shí)世界的場(chǎng)景,并將這些數(shù)據(jù)應(yīng)用于真實(shí)物理環(huán)境中,以此來(lái)縮小模擬與真實(shí)世界之間的差距,具有明顯的成本優(yōu)勢(shì),并且在隱私保護(hù)方面也有很大的作用,但對(duì)于模擬器的要求更高,Reality Gap以及遷移過(guò)程造成的性能下降等問(wèn)題仍需要進(jìn)一步研究解決。

04、行業(yè)情況及業(yè)內(nèi)翹楚

在科技變革的浪潮中,具身智能正以令人矚目的速度重塑產(chǎn)業(yè)版圖。據(jù)數(shù)據(jù)顯示,市場(chǎng)規(guī)模從2018年的2,923億元躍升至2023年的7,487億元,年復(fù)合增長(zhǎng)率高達(dá)20.7%。這一增長(zhǎng)軌跡背后,是中國(guó)科技的快速迭代、數(shù)字化轉(zhuǎn)型的全面推進(jìn),以及人工智能技術(shù)的持續(xù)突破。就像一個(gè)正在覺(jué)醒的巨人,具身智能產(chǎn)業(yè)正在彰顯其無(wú)限潛力,預(yù)示著一個(gè)充滿想象力的未來(lái)正在到來(lái)。

在具身智能的世界中,每一個(gè)構(gòu)成要素如同交響樂(lè)中的樂(lè)章,共同譜寫(xiě)出人形機(jī)器人獨(dú)特的智能表現(xiàn),每個(gè)構(gòu)成要素,也是團(tuán)隊(duì)研究挖掘標(biāo)的的切入點(diǎn)。其中,環(huán)境感知模塊為機(jī)器人提供了“眼睛”和“耳朵”,使其能夠感知周圍環(huán)境的細(xì)微變化。決策控制模塊則擔(dān)當(dāng)“頭腦”的角色,負(fù)責(zé)決策和規(guī)劃。運(yùn)動(dòng)控制模塊好比“小腦”,確保機(jī)器人的靈活和平衡。機(jī)械本體模塊則是其“骨骼和肌肉”,支撐其每一個(gè)動(dòng)作····

在具身智能的產(chǎn)業(yè)版圖上,一批創(chuàng)新企業(yè)正在書(shū)寫(xiě)著行業(yè)發(fā)展的新篇章。我們一直實(shí)時(shí)跟蹤、學(xué)習(xí)國(guó)內(nèi)外優(yōu)秀企業(yè),挖掘潛在優(yōu)質(zhì)標(biāo)的。

05、感悟與體會(huì)

具身智能代表了人工智能發(fā)展的一個(gè)重要方向。它讓AI從虛擬世界走向現(xiàn)實(shí)世界,從單一的信息處理走向綜合的物理交互。目前RT-2和Voxposer等大模型泛化能力仍在提升過(guò)程中,未來(lái)能否達(dá)到商用所需的泛化性能標(biāo)準(zhǔn)存在不確定性。淞靈團(tuán)隊(duì)結(jié)合不斷的行業(yè)體會(huì),將繼續(xù)在感知、認(rèn)知、行動(dòng)層布局、研究。

SIM 2 REAL不是具身重點(diǎn)?;仡欀拔覀儓F(tuán)隊(duì)提出的一個(gè)觀點(diǎn):具身智能最終的表征方式可能不僅僅是人形。這里需要有一個(gè)延伸的邏輯,即SIM 2 REAL會(huì)讓具身智能理解環(huán)境;REAL 2 SIM會(huì)讓具身影響環(huán)境。這樣一個(gè)完美的閉環(huán),將迎來(lái)AI更高階的發(fā)展。其中必不可少的是再次對(duì)AI基礎(chǔ)建設(shè)的改造,以上可能又將是一波AI及其基礎(chǔ)建設(shè)發(fā)展的周期。

隨著中美科技競(jìng)賽的“軍備化”預(yù)演趨勢(shì),我們認(rèn)為模型層中國(guó)可能會(huì)在一定階段處于追趕、跟隨的狀態(tài);數(shù)據(jù)豐富的優(yōu)勢(shì)讓 “中國(guó)涌現(xiàn)能力”后,我國(guó)可能會(huì)在AI Agent及具身領(lǐng)域展現(xiàn)特色優(yōu)勢(shì)。具身領(lǐng)域的“手”、“眼”、“腦”、“模型”等都將是我們關(guān)注及學(xué)習(xí)的重點(diǎn)。我們將持續(xù)不斷深耕研究,挖掘最先進(jìn)、前沿的的賽道資訊,希望和感興趣的朋友多多交流探討。正如著名科學(xué)家所說(shuō):"智能不僅存在于頭腦中,也存在于身體里。"具身智能的發(fā)展,正在讓這句話變成現(xiàn)實(shí)。讓我們拭目以待,見(jiàn)證這場(chǎng)改變的發(fā)生。

關(guān)于一村淞靈

一村淞靈是一村資本位于深圳的全資子公司,專注AI早中期投資,打造淞靈AI生態(tài)朋友圈。

關(guān)于深圳一村淞靈私募創(chuàng)業(yè)投資基金管理有限公司(簡(jiǎn)稱“一村淞靈”或“公司”)一村淞靈成立于2013年,是一家位于深圳的長(zhǎng)期聚焦人工智能、數(shù)字經(jīng)濟(jì)的私募股權(quán)投資管理機(jī)構(gòu)。自成立以來(lái),以其深植產(chǎn)業(yè)的投資邏輯、成熟專業(yè)的投資能力,公司先后發(fā)起并受托管理了國(guó)家科技部、國(guó)家發(fā)改委、深圳市引導(dǎo)基金、青島市經(jīng)信委、深圳市天使引導(dǎo)基金、前海引導(dǎo)基金等多支政府參股基金,在管資產(chǎn)規(guī)模達(dá)20億元。

通過(guò)踐行產(chǎn)融結(jié)合的投資策略和管理模式,經(jīng)典案例包括:生命科學(xué)智造企業(yè)華大智造、醫(yī)藥數(shù)字化臺(tái)“藥師幫”、光電半導(dǎo)體企業(yè)“縱慧芯光”、全球領(lǐng)先的AI視覺(jué)服務(wù)商“視比特機(jī)器人”、全棧式3D視覺(jué)解決方案提供商“光鑒科技”、致力于顛覆式創(chuàng)新的AI芯片設(shè)計(jì)商“墨芯科技”、專注于云計(jì)算和數(shù)據(jù)中心數(shù)據(jù)處理器芯片(DPU)和解決方案的領(lǐng)先半導(dǎo)體公司“云豹智能”。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

標(biāo)簽:

責(zé)任編輯:FD31
上一篇:“萬(wàn)峰成林處 陽(yáng)光黔西南”2024黔西南州冬春文旅推介會(huì)在滬盛大舉行,開(kāi)啟兩地文旅合作新篇章
下一篇:最后一頁(yè)

精彩圖集(熱圖)

熱點(diǎn)圖集

最近更新

信用中國(guó)

  • 信用信息
  • 行政許可和行政處罰
  • 網(wǎng)站文章