據(jù)《人形機器人產(chǎn)業(yè)研究報告》預(yù)測,2024年中國人形機器人市場規(guī)模約27.6億元,到2035年規(guī)模有望達到3000億元。近日,中國電子學(xué)會理事長徐曉蘭表示:“在企業(yè)、政府、應(yīng)用方等各方主體合力作用下,我國人形機器人產(chǎn)業(yè)正處于‘井噴前夜’”,我國人形機器人產(chǎn)業(yè)前景廣闊。如今,人形機器人到底應(yīng)該具備哪些核心能力正在成為未來人形機器人產(chǎn)業(yè)發(fā)展的關(guān)鍵。
人形機器人發(fā)展核心是多場景泛化能力
在眾多關(guān)鍵技術(shù)中,多場景泛化能力無疑是推動人形機器人進步的核心驅(qū)動力。人形機器人通常具備擬人化的軀干、頭部、四肢以及相應(yīng)的感知、驅(qū)動和控制系統(tǒng)。相較于傳統(tǒng)機器人的單一功能,通常只針對特定任務(wù)進行編程,缺乏靈活性和泛化能力,人形機器人能夠執(zhí)行多種任務(wù)并在不同場景下進行自主學(xué)習(xí)和適應(yīng)。
從應(yīng)用角度來看,具備泛化能力的人形機器人可以執(zhí)行多樣化的任務(wù),從家庭服務(wù)到工業(yè)生產(chǎn),大大拓展了應(yīng)用范圍,多場景泛化能力是滿足這些多樣化需求的關(guān)鍵;在不同工作環(huán)境中,泛化能力使機器人能更好地理解和配合人類,提高協(xié)作效率;此外,一臺能適應(yīng)多種場景的機器人比多臺專用機器人更具成本效益,對于商業(yè)化推廣很重要。
多場景泛化能力首先體現(xiàn)在機器人對環(huán)境的感知和建模上?,F(xiàn)實世界環(huán)境復(fù)雜多變,充滿了不確定性和動態(tài)變化,而復(fù)雜環(huán)境感知需要整合視覺、深度、觸覺、聽覺等多種傳感器數(shù)據(jù)。
快速構(gòu)建周圍環(huán)境的三維模型、進行語義理解,不僅感知物體的位置和形狀,還要理解其功能和意義。
其次是運動規(guī)劃與控制。多場景泛化能力能夠?qū)崟r調(diào)整運動軌跡,以應(yīng)對移動的障礙物或突發(fā)情況;根據(jù)不同的地面條件進行自適應(yīng)控制;以及在與環(huán)境交互時,精確控制力度,實現(xiàn)柔順操作。
第三是任務(wù)理解與執(zhí)行。多場景泛化能力能夠進行自然語言理解,理解人類描述的復(fù)雜任務(wù)指令;進行任務(wù)分解,將復(fù)雜任務(wù)分解為一系列基本動作;進行上下文推理,根據(jù)當(dāng)前環(huán)境和任務(wù)背景做出合適的決策。
最后是學(xué)習(xí)與遷移能力。多場景泛化能力能將在一個領(lǐng)域?qū)W到的知識遷移到新的、相似的領(lǐng)域,并在執(zhí)行任務(wù)的過程中不斷優(yōu)化性能,提高學(xué)習(xí)效率。
人形機器人是AI大模型的重要應(yīng)用場景
人形機器人的多場景泛化能力在很大程度上依賴于AI大模型,同時人形機器人也是AI大模型的重要應(yīng)用場景。
日前,中國信息通信研究院人工智能所專家在8月初召開的“AI大模型應(yīng)用場景”產(chǎn)學(xué)研融通創(chuàng)新活動——產(chǎn)業(yè)問題專家研討會上表示:“大模型雖然擁有強大的推理和計算能力,但缺乏實際應(yīng)用,需要與智能體等結(jié)合,才能實現(xiàn)真正的產(chǎn)業(yè)賦能和改變使用場景”。談到最近很火的AI智能體,他說:“大模型必須和智能體或者其他的一些機器人結(jié)合,才能打通大模型落地的最后一公里”。
當(dāng)前隨著AI智能體的快速發(fā)展,使人形機器人有望成為AI大模型應(yīng)用落地的重要場景。
據(jù)不完全統(tǒng)計,截至目前,F(xiàn)igure AI、特斯拉、優(yōu)必選、銀河通用機器人、傅立葉智能、科大訊飛等企業(yè)人形機器人均已接入大模型技術(shù)。
3月,F(xiàn)igure公司首發(fā)了第一個OpenAI大模型加持的機器人,此后,F(xiàn)igure宣布與寶馬制造公司簽署商業(yè)協(xié)議,將AI和機器人技術(shù)整合到汽車生產(chǎn)中。4月,優(yōu)必選與百度官宣合作,其人形機器人Walker S已接入百度文心大模型。6月,銀河通用發(fā)布了首代泛化具身大模型機器人銀河通用G1,已具備超強泛化識別抓取及3D視覺導(dǎo)航能力。7月,優(yōu)必選與吉利和天奇股份達成戰(zhàn)略合作,工業(yè)版人形機器人Walker S Lite“入職”極氪工廠。
此外,AI大模型也在其他機器人領(lǐng)域廣泛應(yīng)用。例如,擎朗智能與微軟Azure云服務(wù)合作,計劃將其基礎(chǔ)大模型能力接入到旗艦機型T10,科大訊飛的星火大模型已賦能400余家機器人企業(yè),覆蓋工業(yè)、公共服務(wù)、家庭等機器人類型。
人形機器人離不開AI大模型
AI大模型的能力正在成為提高人形機器人多場景泛化能力不可或缺的核心要素,尤其在以下幾個關(guān)鍵方面:
自然語言理解與生成
AI大模型在自然語言處理方面具有顯著的優(yōu)勢。它們能夠理解和生成復(fù)雜的自然語言文本,處理各種語義任務(wù),如對話、問答、翻譯等。在人機交互中,特別是需要復(fù)雜指令理解和多輪對話的場景中,AI大模型的自然語言處理能力幾乎是不可或缺的,它們能夠顯著提升機器人與人類溝通的流暢性和智能化水平。
跨領(lǐng)域知識整合
AI大模型經(jīng)過大規(guī)模多領(lǐng)域數(shù)據(jù)訓(xùn)練,能夠跨越不同領(lǐng)域的知識,并將這些知識整合應(yīng)用到新的任務(wù)中,當(dāng)機器人需要在未知環(huán)境中快速適應(yīng)新任務(wù)時,AI大模型的這種跨領(lǐng)域整合能力可以提供關(guān)鍵支持,幫助機器人在多樣化的任務(wù)中表現(xiàn)出色。
復(fù)雜決策和推理
AI大模型在推理和復(fù)雜決策方面表現(xiàn)出色,特別是在非結(jié)構(gòu)化和多維度信息處理方面。例如,在需要理解復(fù)雜的文本或情景以做出合理決策時,AI大模型能夠表現(xiàn)出較強的推理能力。在涉及到高度復(fù)雜的決策任務(wù)時,AI大模型可以提供其他方法難以替代的深層次語義理解和決策支持能力。
大規(guī)模數(shù)據(jù)處理和生成
AI大模型能夠處理和生成大規(guī)模的數(shù)據(jù),這在某些需要大量數(shù)據(jù)輸入或生成復(fù)雜輸出的任務(wù)中是獨特的優(yōu)勢。例如,生成大量合成數(shù)據(jù)以訓(xùn)練機器人,或通過對話生成各種可能的場景和解決方案。
持續(xù)學(xué)習(xí)和適應(yīng)能力
AI大模型通過不斷更新和擴展,可以從新的數(shù)據(jù)中持續(xù)學(xué)習(xí)和適應(yīng),保持對最新信息和趨勢的理解,在需要長期應(yīng)用且環(huán)境變化頻繁的場景中,AI大模型的持續(xù)學(xué)習(xí)能力是不可或缺的。
AI大模型作為提升人形機器人泛化能力不可或缺的核心要素,促使人形機器人具備了在多場景中實現(xiàn)環(huán)境感知和建模、運動規(guī)劃與控制、任務(wù)理解與執(zhí)行、學(xué)習(xí)遷移等更大突破的核心泛化能力。同時,作為AI大模型的重要應(yīng)用場景,人形機器人也推動了AI大模型技術(shù)的實際落地與應(yīng)用。
田鑫,專業(yè)的企業(yè)組網(wǎng)服務(wù)商,致力于為企業(yè)提供企業(yè)組網(wǎng)(SD-WAN、MPLS、云互聯(lián))、數(shù)據(jù)中心、網(wǎng)絡(luò)安全、系統(tǒng)集成服務(wù)、ICT解決方案、行業(yè)IT解決方案等相關(guān)服務(wù)。
更多相關(guān)內(nèi)容推薦:
合盈數(shù)據(jù)楊惜琳:算電互鎖 為新質(zhì)生產(chǎn)力筑基
當(dāng)我們談綠色算力時,我們談些什么?
2024中國綠色算力(人工智能)大會:和林格爾數(shù)據(jù)中心集群的崛起與展望
北京加快邁向人工智能之城
城地香江攜手華為,共啟人工智能算力新篇章
提高人工智能時代口述史研究水平
AI大模型最火應(yīng)用場景?1個月11個融資項目
未來五年,中國AI大模型最有潛力的5大場景
從“無到有”走向“有到優(yōu)” 國產(chǎn)視頻生成大模型漸入佳境
推進大模型賦能網(wǎng)絡(luò)安全
防范人工智能風(fēng)險要有安全閥
AI檢測AI:“矛”更利還是“盾”更堅