2025年國務院政府工作報告提出,將建未來產業投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產業。其中,首次寫入政府工作報告的具身智能,成為科技界的熱詞。目前,包括北京在內的全國多地都已開始布局具身智能等人工智能(AI)技術產業發展。
雖有ChatGPT、DeepSeek珠玉在前,但人們對人工智能的需求已不滿足于這類大語言模型,而是希望研發和使用擁有具身智能的人工智能,這將是未來極具潛力的重要發展方向。
仿生人是具身智能的核心
其實,具身智能的概念早已有之,只不過當時未能實現。1945年,法國哲學家莫里斯·梅洛-蓬蒂提出了“具身性”概念,指出人是通過身體與周圍環境進行互動和感知,進而理解世界。在此基礎上,被譽為“AI之父”的英國科學家圖靈1950年在其論文《計算機器與智能》中首次提出具身智能(Embodied Intelligence)這一概念。
中國計算機學會給具身智能下的定義是,一種基于物理身體進行感知和行動的智能系統,能通過智能體與環境的交互獲取信息、理解問題、做出決策并實現行動,從而產生智能行為和適應性。2024世界機器人大會發布《人形機器人十大趨勢展望》,提出具身智能是可以在重大變化下做出迅猛、精準反應的高質量、高性能智能系統。它既不是單純虛擬環境下的計算機仿真,也不是完全偏于物理空間的機電系統,而是與人形機器人系統緊密相關。
在現實中,人們最希望研發的是擁有具身智能的人形機器人,也就是讓人工智能融入機器,讓機器像人一樣感知、學習和與環境動態交互,并擇機行動。
人工智能有弱人工智能、強人工智能和超人工智能,具身智能屬于強人工智能,是人們最能接受也最適合人的人工智能。因為具身智能可以具有像人一樣的智能,能與人、生物、環境互動,可以學習并采取自主行動,但不會超越人,比起超人工智能而言,是令人放心的存在。這就注定了具身智能是人類下一步會選擇的最理想的人工智能。
像人一樣的具身智能,需具備像人一樣的感官系統、大腦神經系統和骨骼肌肉運動系統,這其實就是仿生人。人的感官是眼耳鼻舌身(皮膚),負責接收外部世界的各種信息。人腦在接收信息后,通過大腦自主學習、思考、規劃,并做出決策。同時,大腦和小腦也負責運動控制,從行走到跑跳,以及從簡單抓取到復雜的手部動作等。
以擁有具身智能的人形機器人為例,它需要有接收感應的裝置,主要是攝像頭、紅外線、雷達等,其大腦就是芯片處理器和軟件系統,能接收攝像頭、紅外線等所傳遞的外部環境各種信息,進行分析和決策,并支配四肢和軀體動作,最后像人一樣運動和完成工作。因此,人形機器人可以在多個領域大顯身手,如應用于智能制造、智能家居、智慧醫療、智能服務、智能交通等方面。
無人駕駛具身智能已初步成熟
比較能體現和發展具身智能的領域是無人駕駛。現在,全球都在研發和嘗試運營無人駕駛,中國的武漢已經有1萬多輛無人駕駛汽車在大街小巷穿行,北京也在試運營無人駕駛汽車。
無人駕駛就像人工駕駛一樣,需要感知、決策和執行。無人駕駛汽車通過攝像頭、雷達和地圖等手段感知周圍障礙物和道路的信息;然后,決定走什么路徑,采用什么車速;最后,將決策轉化成剎車、油門和轉向信號,控制車輛按照預期目標行駛。具體來說,無人駕駛汽車需要對所獲得的周圍環境數據進行處理和融合,生成對環境的準確表示。在了解周圍環境和自身位置的基礎上,無人駕駛汽車的控制系統會生成相應的控制指令(如加速、減速、轉向、剎車等),再通過車輛的各種執行器(如油門、剎車、轉向系統等)予以實施,就如同人在駕駛車輛一樣。
無人駕駛汽車的控制系統無論是裝在車上還是裝在人形機器人駕駛員的大腦內,想要行使功能,都需要擁有具身智能,這一智能是由人使用世界模型(World Model)來教會的。世界模型是人工智能算法模型的一種新概念,旨在模仿人類和動物,通過觀察與交互來學習關于世界運作方式的知識。
簡單總結一下,無人駕駛的具身智能主要體現在感受和執行世界模型這兩方面。一方面,感受由傳感和感知構成,傳感獲得的是傳感器的原始數據(如圖片),而感知是對從攝像頭、雷達傳來的信息進行認知處理(如圖片內容是人還是動物、是否在運動)。另一方面,各類傳感器經由算法處理后得到的障礙物、車道等信息往往存在矛盾,比如,雷達看到前方有一個障礙物而攝像頭認為沒有,這時就需要增加融合模塊來綜合分析,對矛盾的信息作進一步的融合與預測,也就是采用世界模型來處理。世界模型的核心職責就是通過融合來理解當下環境要素的屬性和關系,并配合先驗的規律做出預測和判斷,然后發出指令,這個時間跨度可以從幾毫秒到幾小時。
現在,無人駕駛的具身智能已經初步成熟。就中國而言,無人駕駛技術水平已進入世界第一梯隊,且擁有約43%的全球自動駕駛發明專利。但從世界上這一領域的總體發展情況來看,無人駕駛汽車的具身智能還需要極大提升。
2024年6月,《自然-通訊》發表的一篇論文對真實世界中無人駕駛汽車的安全性進行了全面分析。對2016年至2022年間2100個配備有高級自動駕駛系統和高級輔助駕駛系統的車輛,以及35133輛人類駕駛車輛的事故數據(主要來自美國加州)進行了對比,結果顯示,在大多數場景下無人駕駛汽車導致的事故比人類駕駛汽車更少。但是,在特定情境下無人駕駛汽車似乎更易發生事故,如晨昏弱光環境下和轉彎時,事故率分別是人類駕駛的5.25倍和1.98倍。
手術機器人“巧手”突破人類極限
前段時間人們津津樂道的AI+醫生只是人工智能應用于醫療的初級階段,它是一種診斷軟件,可以幫助醫生會診和提出治療方案。到了中高級階段,擁有具身智能的人形機器人可以做到問診患者甚至實施手術,其手部的靈巧性、精確性將更勝一籌。
早已進入一些國家臨床醫療的達芬奇手術機器人具有“少量”的具身智能,畢竟它還需要外科醫生來操作。
達芬奇手術機器人是一個系統,由3個部分組成:主刀醫師操作控制臺;三維成像視頻影像平臺;機械臂、攝像臂和手術器械組成的移動平臺。實施手術時,主刀醫生不與患者直接接觸,通過三維視覺系統和動作定標系統操作控制,由機械臂及手術器械來完成醫生的技術動作和手術操作。其中,三維成像視頻影像平臺就像人的眼睛,機械臂、攝像臂和手術器械組成的移動平臺類似人的上下肢,不過操控的大腦還是人類醫生。
即便如此,手術機器人的感知系統和上肢、手部動作也比人更有優勢。3D高清影像技術可以為主刀醫生提供高清晰和全方位立體式手術視野,對手術的局部位置視野放大15倍,不僅能精確定位手術部位,還能讓醫生看得更清楚。醫生操控的機器人手指可以突破人手不可能完成的極限,實現360°旋轉,在有限的空間內多個維度任意變換操作姿勢。機器人手指可以使用手術刀、剪刀、鑷子或縫線所需的持針器,快速完成切割、電燒、縫合、打結等動作,其精確度和靈巧度比人的雙手有過之而無不及。手術機器人還擁有“三頭六臂”(有多個微創手術刀和可旋轉支架,能使微創手術刀旋轉到患者的任何部位),這使得它能夠完成一個手術團隊的全部工作,減少了配合失誤,更容易實現主刀醫生的意圖。
2000年,美國食品與藥物管理局(FDA)批準使用由美國直覺外科公司設計和制造的達芬奇手術機器人。第四代達芬奇手術機器人(達芬奇Xi系統)于2015年上市。2023年,中國復星醫藥研制的首臺國產達芬奇Xi手術機器人獲得國家藥監局批準。
中國的達芬奇Xi手術機器人具有三維高清視野、可轉腕手術器械和直覺式動作控制三大特性,可以將外科醫生手部動作的顫抖自動濾除并轉換成更精準的動作,其彎曲及旋轉程度遠超人手極限,讓機器人輔助手術變成了現實。目前,達芬奇手術機器人已經廣泛應用于成人和兒童的普通外科、胸外科、泌尿外科、婦產科、頭頸外科,以及心臟手術。
總體來看,達芬奇手術機器人的具身智能還是相當有限的,但不能否認它為外科手術帶來了巨大改變,全球現有超1200萬名患者接受過達芬奇手術機器人的服務。未來,科學家將致力于研發擁有具身智能的人形手術機器人,能大部分或全部取代人類外科醫生,親自實施手術。當然,一個重要前提是,由人類外科醫生監管整個手術過程,如發現異常,立即停止機器人的操作,并接管手術。
“助老”先要模擬人的真實感覺
擁有具身智能的機器人現在和未來有個最廣泛的需求,就是照料老人。
今年2月,國際電工委員會(IEC)發布了由中國牽頭制定的養老機器人國際標準《互聯家庭環境下使用的主動輔助生活機器人性能準則》,該標準依據老年人生理和行為特點,為各類養老機器人的產品設計、制造、測試和認證等提供基準。現在已有一些科技產品進入市場,比如,江蘇無錫研發的“大頭阿亮”智能養老機器人,能按時提醒老人吃藥、吃飯、休息,還可播放新聞、協助網購;北京為700多戶老人配備的養老機器人,可呼叫家政服務、緊急呼救等。
養老機器人普遍整合了掃地機、洗碗機、手機、輪椅的功能,能提供日常清潔、餐飲服務,還能陪伴交流,但只是有一定程度的具身智能。姑且不要求養老機器人會獨立做飯,即便是低要求的具身智能,如像人一樣能為失能老人端飯倒茶、攙扶老人行走等,都還不能實現。
理想中的具身智能要求機器人的手能伸、握、捏,抓取東西、旋轉開瓶蓋,有溫覺、痛覺、觸覺(如發現水溫不舒適,不能遞給老人飲用)等。目前,研究人員正在努力讓機器人的手具有人的真實感覺。最近,美國約翰斯·霍普金斯大學研發的仿生手達到具身智能的新高度,仿生手的觸覺反饋讓它可以“感知”物體,能穩穩抓住水瓶,也能輕輕捏起裝滿水的塑料杯卻不會弄壞它。
這種仿生手通過3個要件來體現具身智能:一是傳感器探知環境;二是控制系統將數據轉為神經信號;三是刺激神經傳遞觸覺。仿生手在觸摸物體時產生觸覺,這些觸覺通過電流傳導到人工大腦(控制器),然后,機器學習算法會處理觸覺信號并轉化為逼真的觸感,再通過電刺激傳遞給神經,讓仿生手“感覺”到手里的東西,從而做出種種適合于人、物體和場景的動作。可想而知,如果這樣的仿生手、仿生腳安裝在人形機器人身上,那它就會擁有像人一樣的觸覺、感覺、知覺,成為更好的具身智能。
總之,作為人工智能與機器人學交叉的前沿領域,具身智能蘊含著巨大的市場潛力和發展機遇。而如何制定具身智能技術倫理和道德準則來確保其良性發展,也是個同樣迫切的問題。只有技術突破和管理相結合,以及價格親民,具身智能才會真正來到人們身邊。
2025年國務院政府工作報告提出,將建未來產業投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產業。其中,首次寫入政府工作報告的具身智能,成為科技界的熱詞。目前,包括北京在內的全國多地都已開始布局具身智能等人工智能(AI)技術產業發展。
雖有ChatGPT、DeepSeek珠玉在前,但人們對人工智能的需求已不滿足于這類大語言模型,而是希望研發和使用擁有具身智能的人工智能,這將是未來極具潛力的重要發展方向。
仿生人是具身智能的核心
其實,具身智能的概念早已有之,只不過當時未能實現。1945年,法國哲學家莫里斯·梅洛-蓬蒂提出了“具身性”概念,指出人是通過身體與周圍環境進行互動和感知,進而理解世界。在此基礎上,被譽為“AI之父”的英國科學家圖靈1950年在其論文《計算機器與智能》中首次提出具身智能(Embodied Intelligence)這一概念。
中國計算機學會給具身智能下的定義是,一種基于物理身體進行感知和行動的智能系統,能通過智能體與環境的交互獲取信息、理解問題、做出決策并實現行動,從而產生智能行為和適應性。2024世界機器人大會發布《人形機器人十大趨勢展望》,提出具身智能是可以在重大變化下做出迅猛、精準反應的高質量、高性能智能系統。它既不是單純虛擬環境下的計算機仿真,也不是完全偏于物理空間的機電系統,而是與人形機器人系統緊密相關。
在現實中,人們最希望研發的是擁有具身智能的人形機器人,也就是讓人工智能融入機器,讓機器像人一樣感知、學習和與環境動態交互,并擇機行動。
人工智能有弱人工智能、強人工智能和超人工智能,具身智能屬于強人工智能,是人們最能接受也最適合人的人工智能。因為具身智能可以具有像人一樣的智能,能與人、生物、環境互動,可以學習并采取自主行動,但不會超越人,比起超人工智能而言,是令人放心的存在。這就注定了具身智能是人類下一步會選擇的最理想的人工智能。
像人一樣的具身智能,需具備像人一樣的感官系統、大腦神經系統和骨骼肌肉運動系統,這其實就是仿生人。人的感官是眼耳鼻舌身(皮膚),負責接收外部世界的各種信息。人腦在接收信息后,通過大腦自主學習、思考、規劃,并做出決策。同時,大腦和小腦也負責運動控制,從行走到跑跳,以及從簡單抓取到復雜的手部動作等。
以擁有具身智能的人形機器人為例,它需要有接收感應的裝置,主要是攝像頭、紅外線、雷達等,其大腦就是芯片處理器和軟件系統,能接收攝像頭、紅外線等所傳遞的外部環境各種信息,進行分析和決策,并支配四肢和軀體動作,最后像人一樣運動和完成工作。因此,人形機器人可以在多個領域大顯身手,如應用于智能制造、智能家居、智慧醫療、智能服務、智能交通等方面。
無人駕駛具身智能已初步成熟
比較能體現和發展具身智能的領域是無人駕駛。現在,全球都在研發和嘗試運營無人駕駛,中國的武漢已經有1萬多輛無人駕駛汽車在大街小巷穿行,北京也在試運營無人駕駛汽車。
無人駕駛就像人工駕駛一樣,需要感知、決策和執行。無人駕駛汽車通過攝像頭、雷達和地圖等手段感知周圍障礙物和道路的信息;然后,決定走什么路徑,采用什么車速;最后,將決策轉化成剎車、油門和轉向信號,控制車輛按照預期目標行駛。具體來說,無人駕駛汽車需要對所獲得的周圍環境數據進行處理和融合,生成對環境的準確表示。在了解周圍環境和自身位置的基礎上,無人駕駛汽車的控制系統會生成相應的控制指令(如加速、減速、轉向、剎車等),再通過車輛的各種執行器(如油門、剎車、轉向系統等)予以實施,就如同人在駕駛車輛一樣。
無人駕駛汽車的控制系統無論是裝在車上還是裝在人形機器人駕駛員的大腦內,想要行使功能,都需要擁有具身智能,這一智能是由人使用世界模型(World Model)來教會的。世界模型是人工智能算法模型的一種新概念,旨在模仿人類和動物,通過觀察與交互來學習關于世界運作方式的知識。
簡單總結一下,無人駕駛的具身智能主要體現在感受和執行世界模型這兩方面。一方面,感受由傳感和感知構成,傳感獲得的是傳感器的原始數據(如圖片),而感知是對從攝像頭、雷達傳來的信息進行認知處理(如圖片內容是人還是動物、是否在運動)。另一方面,各類傳感器經由算法處理后得到的障礙物、車道等信息往往存在矛盾,比如,雷達看到前方有一個障礙物而攝像頭認為沒有,這時就需要增加融合模塊來綜合分析,對矛盾的信息作進一步的融合與預測,也就是采用世界模型來處理。世界模型的核心職責就是通過融合來理解當下環境要素的屬性和關系,并配合先驗的規律做出預測和判斷,然后發出指令,這個時間跨度可以從幾毫秒到幾小時。
現在,無人駕駛的具身智能已經初步成熟。就中國而言,無人駕駛技術水平已進入世界第一梯隊,且擁有約43%的全球自動駕駛發明專利。但從世界上這一領域的總體發展情況來看,無人駕駛汽車的具身智能還需要極大提升。
2024年6月,《自然-通訊》發表的一篇論文對真實世界中無人駕駛汽車的安全性進行了全面分析。對2016年至2022年間2100個配備有高級自動駕駛系統和高級輔助駕駛系統的車輛,以及35133輛人類駕駛車輛的事故數據(主要來自美國加州)進行了對比,結果顯示,在大多數場景下無人駕駛汽車導致的事故比人類駕駛汽車更少。但是,在特定情境下無人駕駛汽車似乎更易發生事故,如晨昏弱光環境下和轉彎時,事故率分別是人類駕駛的5.25倍和1.98倍。
手術機器人“巧手”突破人類極限
前段時間人們津津樂道的AI+醫生只是人工智能應用于醫療的初級階段,它是一種診斷軟件,可以幫助醫生會診和提出治療方案。到了中高級階段,擁有具身智能的人形機器人可以做到問診患者甚至實施手術,其手部的靈巧性、精確性將更勝一籌。
早已進入一些國家臨床醫療的達芬奇手術機器人具有“少量”的具身智能,畢竟它還需要外科醫生來操作。
達芬奇手術機器人是一個系統,由3個部分組成:主刀醫師操作控制臺;三維成像視頻影像平臺;機械臂、攝像臂和手術器械組成的移動平臺。實施手術時,主刀醫生不與患者直接接觸,通過三維視覺系統和動作定標系統操作控制,由機械臂及手術器械來完成醫生的技術動作和手術操作。其中,三維成像視頻影像平臺就像人的眼睛,機械臂、攝像臂和手術器械組成的移動平臺類似人的上下肢,不過操控的大腦還是人類醫生。
即便如此,手術機器人的感知系統和上肢、手部動作也比人更有優勢。3D高清影像技術可以為主刀醫生提供高清晰和全方位立體式手術視野,對手術的局部位置視野放大15倍,不僅能精確定位手術部位,還能讓醫生看得更清楚。醫生操控的機器人手指可以突破人手不可能完成的極限,實現360°旋轉,在有限的空間內多個維度任意變換操作姿勢。機器人手指可以使用手術刀、剪刀、鑷子或縫線所需的持針器,快速完成切割、電燒、縫合、打結等動作,其精確度和靈巧度比人的雙手有過之而無不及。手術機器人還擁有“三頭六臂”(有多個微創手術刀和可旋轉支架,能使微創手術刀旋轉到患者的任何部位),這使得它能夠完成一個手術團隊的全部工作,減少了配合失誤,更容易實現主刀醫生的意圖。
2000年,美國食品與藥物管理局(FDA)批準使用由美國直覺外科公司設計和制造的達芬奇手術機器人。第四代達芬奇手術機器人(達芬奇Xi系統)于2015年上市。2023年,中國復星醫藥研制的首臺國產達芬奇Xi手術機器人獲得國家藥監局批準。
中國的達芬奇Xi手術機器人具有三維高清視野、可轉腕手術器械和直覺式動作控制三大特性,可以將外科醫生手部動作的顫抖自動濾除并轉換成更精準的動作,其彎曲及旋轉程度遠超人手極限,讓機器人輔助手術變成了現實。目前,達芬奇手術機器人已經廣泛應用于成人和兒童的普通外科、胸外科、泌尿外科、婦產科、頭頸外科,以及心臟手術。
總體來看,達芬奇手術機器人的具身智能還是相當有限的,但不能否認它為外科手術帶來了巨大改變,全球現有超1200萬名患者接受過達芬奇手術機器人的服務。未來,科學家將致力于研發擁有具身智能的人形手術機器人,能大部分或全部取代人類外科醫生,親自實施手術。當然,一個重要前提是,由人類外科醫生監管整個手術過程,如發現異常,立即停止機器人的操作,并接管手術。
“助老”先要模擬人的真實感覺
擁有具身智能的機器人現在和未來有個最廣泛的需求,就是照料老人。
今年2月,國際電工委員會(IEC)發布了由中國牽頭制定的養老機器人國際標準《互聯家庭環境下使用的主動輔助生活機器人性能準則》,該標準依據老年人生理和行為特點,為各類養老機器人的產品設計、制造、測試和認證等提供基準。現在已有一些科技產品進入市場,比如,江蘇無錫研發的“大頭阿亮”智能養老機器人,能按時提醒老人吃藥、吃飯、休息,還可播放新聞、協助網購;北京為700多戶老人配備的養老機器人,可呼叫家政服務、緊急呼救等。
養老機器人普遍整合了掃地機、洗碗機、手機、輪椅的功能,能提供日常清潔、餐飲服務,還能陪伴交流,但只是有一定程度的具身智能。姑且不要求養老機器人會獨立做飯,即便是低要求的具身智能,如像人一樣能為失能老人端飯倒茶、攙扶老人行走等,都還不能實現。
理想中的具身智能要求機器人的手能伸、握、捏,抓取東西、旋轉開瓶蓋,有溫覺、痛覺、觸覺(如發現水溫不舒適,不能遞給老人飲用)等。目前,研究人員正在努力讓機器人的手具有人的真實感覺。最近,美國約翰斯·霍普金斯大學研發的仿生手達到具身智能的新高度,仿生手的觸覺反饋讓它可以“感知”物體,能穩穩抓住水瓶,也能輕輕捏起裝滿水的塑料杯卻不會弄壞它。
這種仿生手通過3個要件來體現具身智能:一是傳感器探知環境;二是控制系統將數據轉為神經信號;三是刺激神經傳遞觸覺。仿生手在觸摸物體時產生觸覺,這些觸覺通過電流傳導到人工大腦(控制器),然后,機器學習算法會處理觸覺信號并轉化為逼真的觸感,再通過電刺激傳遞給神經,讓仿生手“感覺”到手里的東西,從而做出種種適合于人、物體和場景的動作。可想而知,如果這樣的仿生手、仿生腳安裝在人形機器人身上,那它就會擁有像人一樣的觸覺、感覺、知覺,成為更好的具身智能。
總之,作為人工智能與機器人學交叉的前沿領域,具身智能蘊含著巨大的市場潛力和發展機遇。而如何制定具身智能技術倫理和道德準則來確保其良性發展,也是個同樣迫切的問題。只有技術突破和管理相結合,以及價格親民,具身智能才會真正來到人們身邊。
本文鏈接:http://m.020gz.com.cn/news-2-1301-0.html“具身智能”版AI與人類最合拍
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕