具身智能商業(yè)化前景不明朗? 專家表示:長坡厚雪未來可期
機(jī)器人“小?!?亮相2025中關(guān)村論壇年會 記者 楊潔 攝
3月28日,金沙江創(chuàng)投管理合伙人朱嘯虎在接受采訪時指出,金沙江天使基金在過去幾年投過一些早期的具身智能項目,最近幾個月都在退出。一石激起千層浪,“具身智能商業(yè)化路徑是否清晰?”“具身智能投資是否存在太多泡沫?”等話題近日引發(fā)業(yè)內(nèi)熱議。
對此,在日前舉行的2025中關(guān)村論壇年會上,多位專家學(xué)者在接受中國證券報記者采訪時表示,具身智能是一個長坡厚雪的賽道,雖然商業(yè)化落地還需要時間,但未來應(yīng)用場景廣泛,前景可期,而多模態(tài)大模型技術(shù)以及世界模型將是最終實現(xiàn)真正AGI的必由之路。
商業(yè)化短期面臨瓶頸
“我們天使基金在過去幾年投過一些早期的具身智能項目,最近幾個月都在退出……我問這幾個CEO,你們商業(yè)化可能的客戶在哪里?我感覺他們說的都是自己想象出來的客戶,誰會花十幾萬買一個機(jī)器人去干這些活?”朱嘯虎在接受媒體采訪時表示,金沙江創(chuàng)投的投資理念一直強(qiáng)調(diào)要聚焦在能夠看到清晰的商業(yè)化可能性的賽道上,這是該機(jī)構(gòu)在過去20年堅持的投資策略。
專家表示,具身智能是一個長坡厚雪的賽道,從商業(yè)化落地的短期角度來看,具身智能當(dāng)前在應(yīng)用層面確實還存在不少瓶頸。
北京智源人工智能研究院院長王仲遠(yuǎn)對中國證券報記者表示,首先,硬件依然不夠成熟、成本比較高,阻礙了具身智能產(chǎn)品進(jìn)入更多場景落地應(yīng)用;其次,應(yīng)用量少也使得具身智能所需的數(shù)據(jù)有限,導(dǎo)致具身模型能力偏弱,而模型能力不足,又進(jìn)一步導(dǎo)致落地應(yīng)用更加困難,這就形成了具身智能進(jìn)入發(fā)展的“循環(huán)悖論”。
中國工程院院士張平在接受中國證券報記者采訪時則坦言,“大家看到很多跳舞、打拳的機(jī)器人,會覺得很新奇,但實際上它們都是按照預(yù)先程序設(shè)置好的,很少有能真正根據(jù)對外界環(huán)境的感知情況而快速產(chǎn)生交互反應(yīng)的,但我們期待它應(yīng)該是跟我們?nèi)祟愐粯樱瑢崿F(xiàn)非?!z滑’的交互和反應(yīng)執(zhí)行?!?/p>
未來發(fā)展前景可期
雖然短期內(nèi)在商業(yè)化落地上還存在瓶頸,但展望未來,具身智能的發(fā)展前景無疑令人期待。
在3月29日舉行的2025中關(guān)村論壇年會未來人工智能先鋒論壇上,科學(xué)技術(shù)部一司副司長康相武表示,具身智能正成為打通物理世界與人工智能交匯的突破口,人機(jī)混合、增強(qiáng)智能等多技術(shù)路線加速演進(jìn),有望催生通用人工智能新范式,實現(xiàn)重大技術(shù)變革。
王仲遠(yuǎn)對中國證券報記者表示,端到端的具身智能需要非常海量的數(shù)據(jù),也許需要5年后乃至10年后才能夠成熟?!安煌顿Y機(jī)構(gòu)有不同的投資風(fēng)格,如果比較看重短期的產(chǎn)業(yè)落地應(yīng)用,那也許現(xiàn)在進(jìn)入具身智能并不是一個特別好的時機(jī),但是從研究機(jī)構(gòu)的角度,我們對于具身智能長期發(fā)展是非常樂觀的,就好像10年前看無人駕駛技術(shù)一樣。”
北京航空航天大學(xué)機(jī)器人研究所名譽(yù)所長王田苗則告訴中國證券報記者,穩(wěn)定性、操作效能、安全及成本等要素是一項新技術(shù)產(chǎn)業(yè)化的重要衡量標(biāo)準(zhǔn),“作為具身智能大家庭中的一員,人形機(jī)器人未來10年有望走入到工業(yè)、特種行業(yè)等場景,在充分驗證后會進(jìn)入家庭,大家的期待還需要時間?!?/p>
多模態(tài)大模型為必由之路
王仲遠(yuǎn)表示,現(xiàn)在關(guān)于具身智能的技術(shù)路線還沒有完全達(dá)成共識,很多機(jī)器人依然大量使用強(qiáng)化學(xué)習(xí)訓(xùn)練,比如不斷地教機(jī)器人學(xué)抓杯子、倒水、用毛筆寫字等,泛化性操作能力會偏弱。
他認(rèn)為,多模態(tài)大模型技術(shù)以及世界模型是最終實現(xiàn)真正的AGI的必由之路,也給具身智能領(lǐng)域帶來新的變量,“如果多模態(tài)大模型能夠真正理解這個世界,就能夠像人類的大腦一樣被裝到具身機(jī)器人的身體里,幫助機(jī)器人真正看到這個世界,對人類發(fā)出的指令進(jìn)行拆解、邏輯推理、規(guī)劃決策,同時還能夠分配給不同類型的本體構(gòu)型進(jìn)行指令的執(zhí)行。我相信后續(xù)也會有越來越多具身大模型出現(xiàn),推動具身智能尤其具身機(jī)器人進(jìn)一步發(fā)展。”
但是具身大模型也存在“不好用、不易用、不通用”的問題。在論壇上,智源研究院發(fā)布了首個跨本體具身大小腦協(xié)作框架RoboOS與開源具身大腦RoboBrain。
王仲遠(yuǎn)介紹,RoboOS專為解決當(dāng)前具身智能落地過程中的通用性適配與多機(jī)調(diào)度難題,RoboBrain則能夠助力機(jī)器人增強(qiáng)長程操作任務(wù)的規(guī)劃和執(zhí)行能力,解決真實場景的復(fù)雜任務(wù)?,F(xiàn)場的演示中,在RoboBrain指揮和RoboOS調(diào)度下,單臂機(jī)器人和人形機(jī)器人協(xié)作,共同完成了人類發(fā)出的拿取蘋果及削皮刀的任務(wù)指令。
王田苗表示,現(xiàn)在有的人對具身智能的理解過于狹窄,認(rèn)為具身智能就是人形機(jī)器人,但實際上,具身智能不僅僅是人形機(jī)器人,人形機(jī)器人只是具身智能大家庭中的一員,未來十年人形機(jī)器人可能在“人工智能+機(jī)器人”的范疇中所占的比例只有10%左右。
王仲遠(yuǎn)表示:“如果我們關(guān)注的是短期的商業(yè)化落地,人形機(jī)器人的構(gòu)型可能反而會帶來很多落地上的困難。但從長期來看,人形機(jī)器人有它的優(yōu)勢,因為人類社會的基礎(chǔ)設(shè)施是依據(jù)人類特征來建設(shè)的,類人的構(gòu)型一定能夠更好地適應(yīng)這些基礎(chǔ)設(shè)施,同時也能夠更好地從當(dāng)前人類社會海量的數(shù)據(jù)中去學(xué)習(xí)技能。我認(rèn)為人形機(jī)器人一定是正確的發(fā)展方向?!?/p>