今年全國兩會上,人工智能依然是代表委員們熱議的焦點。與過往更多關(guān)注大語言模型、通用人工智能等數(shù)字世界的突破不同,如何讓AI“走出屏幕”,在物理世界中完成復(fù)雜任務(wù),正成為產(chǎn)業(yè)界和學(xué)界思考的下一個關(guān)鍵命題。
多位代表委員及業(yè)內(nèi)專家關(guān)注AI在物理世界落地這一愿景的核心技術(shù)——具身智能產(chǎn)業(yè)的快速高質(zhì)量發(fā)展。他們普遍認為,具身智能基礎(chǔ)模型,即機器人“大腦”是產(chǎn)業(yè)突破的關(guān)鍵戰(zhàn)場,需要多方聯(lián)合營造良好生態(tài),鼓勵企業(yè)自主創(chuàng)新。
“身體”強健“大腦”不足,產(chǎn)業(yè)瓶頸亟需突破
今年政府工作報告明確提出,培育壯大新興產(chǎn)業(yè)和未來產(chǎn)業(yè)。建立未來產(chǎn)業(yè)投入增長和風(fēng)險分擔機制,培育發(fā)展未來能源、量子科技、具身智能、腦機接口、6G等未來產(chǎn)業(yè)。
這是“具身智能”連續(xù)第二次出現(xiàn)在政府工作報告中,標志著這一前沿技術(shù)已從技術(shù)研發(fā)階段正式邁入國家戰(zhàn)略層面的產(chǎn)業(yè)化培育期,成為新質(zhì)生產(chǎn)力的關(guān)鍵組成部分。但截止到目前,許多具身智能機器人雖然能在春晚等舞臺,按照預(yù)先編好的程序完成精彩表演,卻未能大規(guī)模進入嚴肅的生產(chǎn)力場景。
對此,全國政協(xié)常委張連起在走訪調(diào)研了大量科技企業(yè)后了解到問題所在:“我國人形機器人之所以遲遲無法批量進入工廠和家庭,缺的不是‘身體’,而是能思考、會學(xué)習(xí)的‘大腦’。”,他指出,當前我國在具身智能應(yīng)用場景、數(shù)據(jù)、硬件等多個維度已形成全球領(lǐng)先優(yōu)勢,但模型能力發(fā)展有所滯后,影響了行業(yè)高質(zhì)量發(fā)展。
“‘大腦’是具身智能產(chǎn)業(yè)突破的關(guān)鍵戰(zhàn)場。”張連起表示,當前產(chǎn)業(yè)界和公眾對具身智能存在一些認知誤區(qū),體現(xiàn)出“重硬件輕軟件、重集成輕研發(fā)”的傾向。例如,簡單地將“大語言模型”加上“動作模塊”就等同于具身智能。“這是大錯特錯。這種為數(shù)字世界設(shè)計的模型,難以應(yīng)對物理世界的高度隨機性與不可預(yù)測性。真正能讓機器人在真實場景中操作長步驟復(fù)雜任務(wù)的,必須是物理世界原生驅(qū)動的具身基礎(chǔ)模型?!睆堖B起表示。
確立自研戰(zhàn)略,聚焦原始創(chuàng)新“大腦”企業(yè)
針對如何突破具身智能技術(shù)瓶頸,張連起建議確立自主研發(fā)戰(zhàn)略,支持原始創(chuàng)新。全國人大代表、海爾集團董事局主席周云杰亦持類似觀點,他指出,我國具身智能正處于技術(shù)爆發(fā)與產(chǎn)業(yè)導(dǎo)入交叉期,呼吁設(shè)立國家重點研發(fā)專項,集中攻關(guān)核心算法,支持關(guān)鍵硬件研發(fā)與產(chǎn)業(yè)化,從源頭提升產(chǎn)業(yè)競爭力。
盡管我國具身智能基礎(chǔ)模型相對于硬件發(fā)展有所滯后,但也涌現(xiàn)出一批優(yōu)秀企業(yè)。張連起在調(diào)研了自變量機器人等聚焦“大腦”研發(fā)的代表性企業(yè)后表示:“近幾年,國內(nèi)一批聚焦這一領(lǐng)域的公司陸續(xù)成立并取得了飛速發(fā)展。這類企業(yè)之所以值得關(guān)注,在于其成立之初就聚焦具身基礎(chǔ)模型自主研發(fā),并堅持以極具前瞻性的端到端統(tǒng)一架構(gòu)來高效訓(xùn)練迭代?!?/p>
據(jù)了解,自變量是國內(nèi)最早聚焦端到端通用具身基礎(chǔ)模型研發(fā)的企業(yè)之一。在技術(shù)路線上,自變量選擇了更具挑戰(zhàn)但也更貼近物理世界本質(zhì)的端到端統(tǒng)一架構(gòu)進行正向研發(fā)。其自研的「WALL-A」模型,核心架構(gòu)首創(chuàng)了視覺-語言-動作模型(VLA)與世界模型深度融合的系統(tǒng)范式。該模型采用原生多模態(tài)輸入輸出設(shè)計,率先實現(xiàn)“具身多模態(tài)思維鏈”,這一技術(shù)融合顯著提升了機器人應(yīng)對未知情境的強大泛化能力,通過自主學(xué)習(xí)在物理世界中持續(xù)進化。
模型持續(xù)進化,正是驅(qū)動具身智能廣泛進入真實場景落地應(yīng)用的關(guān)鍵。全國政協(xié)委員、科技部原副部長李萌指出:“具身智能作為與物理實體融合的人工智能,具備在與物理世界的互動中自主學(xué)習(xí)、持續(xù)學(xué)習(xí)的能力,正在成為改變?nèi)祟惿a(chǎn)生活方式、推動社會智能躍升的重要引擎?!彼硎荆瑹o論從科學(xué)前景、技術(shù)前景、產(chǎn)業(yè)前景還是社會前景看,這方面技術(shù)突破都具有非常重要的意義和價值。
破解數(shù)據(jù)瓶頸,應(yīng)由模型定義數(shù)據(jù)采集標準
數(shù)據(jù)是訓(xùn)練強大“大腦”的關(guān)鍵“養(yǎng)料”。多位專家指出,當前行業(yè)普遍存在數(shù)據(jù)采集低效、“模型-數(shù)據(jù)”飛輪難以形成的問題。許多數(shù)據(jù)采集工作與模型研發(fā)的真實需求脫節(jié),導(dǎo)致大量資源浪費在無效或低質(zhì)數(shù)據(jù)上。
解決之道在于確立‘模型定義數(shù)據(jù)’的采集機制,由真正開展模型研發(fā)的企業(yè)來定義所需數(shù)據(jù)的規(guī)格、質(zhì)量與場景。例如中國信息通信研究院副院長魏亮就強調(diào):應(yīng)充分發(fā)揮具備具身智能基礎(chǔ)模型自研能力的行業(yè)領(lǐng)軍企業(yè)的引領(lǐng)作用,由其牽頭推進數(shù)據(jù)工廠數(shù)據(jù)集標準的研制與落地工作。唯有確立統(tǒng)一、規(guī)范的標準,才能從根本上優(yōu)化行業(yè)數(shù)據(jù)采集模式,實現(xiàn)采集成本的系統(tǒng)性下降與綜合運營效率的全面提升。
作為具身智能從業(yè)者,自變量創(chuàng)始人兼CEO王潛介紹,自變量機器人是國內(nèi)最早規(guī)?;瘮U展真機數(shù)據(jù)采集的公司,堅持硬件-數(shù)據(jù)-模型的閉環(huán)迭代,通過基礎(chǔ)模型給數(shù)據(jù)處理和硬件設(shè)計等各個環(huán)節(jié)提供反饋,迭代更高質(zhì)量的數(shù)據(jù)和更高效率的數(shù)采設(shè)備,進一步提升基礎(chǔ)模型的效果。
構(gòu)建良好創(chuàng)新生態(tài),培育具身智能"熱帶雨林"
具身智能作為典型的前沿科技,其研發(fā)具有周期長、投入大、不確定性高的特點。多位代表委員指出,推動這一前沿產(chǎn)業(yè)發(fā)展,不能僅靠企業(yè)單點突破,更需構(gòu)建一個能匹配其長周期特征的、包容而穩(wěn)健的創(chuàng)新生態(tài)系統(tǒng)。
全國政協(xié)常委、中國電子學(xué)會理事長徐曉蘭從產(chǎn)業(yè)格局視角進行了分析。她指出,具身智能將推動AI從“通用技術(shù)”向“場景化應(yīng)用”升級,帶動算力、數(shù)據(jù)、算法突破。一個健康、自主的產(chǎn)業(yè)生態(tài)是實現(xiàn)這一目標的關(guān)鍵。徐曉蘭認為,具身智能產(chǎn)業(yè)將形成“3+3”發(fā)展格局:頂層是具備整機研發(fā)與生態(tài)能力的龍頭企業(yè),中層是專精特新企業(yè),底層是技術(shù)與基礎(chǔ)制造企業(yè);同時配套安全、維修、標準三大體系,為產(chǎn)業(yè)發(fā)展筑牢根基。
全國政協(xié)委員、廣州市科技局原局長王桂林倡導(dǎo)重塑“人才驅(qū)動、企業(yè)主導(dǎo)、活力涌現(xiàn)”的創(chuàng)新范式,推動科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合。他特別強調(diào),應(yīng)鼓勵更多經(jīng)營主體與科研院所組建創(chuàng)新聯(lián)合體,探索更優(yōu)的融合發(fā)展模式。
堅實的生態(tài)離不開政策引導(dǎo)與適配的金融“活水”。張連起建議,應(yīng)構(gòu)建適配長周期創(chuàng)新的金融支持體系,并面向優(yōu)質(zhì)具身智能企業(yè)開放工業(yè)、民生等真實場景,將政策支持與技術(shù)穩(wěn)定性、實際成效掛鉤。王桂林則強調(diào),要把“投早、投小、投長期、投硬科技”落到實處,將政策重心從定向扶持轉(zhuǎn)向環(huán)境營造,通過強化風(fēng)險兜底,營造更具多樣性和包容性的“熱帶雨林”式創(chuàng)新生態(tài)。