從今以后,我不奉陪了第038167集
近日,動態(tài)北京人形機(jī)器人創(chuàng)新中心以直播的北京方式展示了人形機(jī)器人“大腦”的最新突破。搭載通用具身智能平臺“慧思開物”的人形人首從今以后,我不奉陪了智能體,在行業(yè)首次實現(xiàn)全局場景感知與動態(tài)記憶突破,機(jī)器局場景感可以做到眼里有活、次實手里有數(shù),現(xiàn)全為日后人形機(jī)器人走向家庭、知動商業(yè)、態(tài)記工業(yè)場景提供了可直接落地的憶突智能底座。
去年,動態(tài)北京人形機(jī)器人創(chuàng)新中心發(fā)布全球首個實現(xiàn)“一腦多機(jī)”“一腦多能”的北京通用具身智能平臺——慧思開物,為機(jī)器人配備更聰明的人形人首從今以后,我不奉陪了“大腦”和“小腦”。該平臺在發(fā)布之初就顛覆了傳統(tǒng)機(jī)器人基于單一場景、機(jī)器局場景感單一任務(wù)做專項開發(fā)的次實傳統(tǒng)模式,推動提升機(jī)器人在復(fù)雜環(huán)境里自主決策與執(zhí)行能力。現(xiàn)全
如今,搭載了慧思開物平臺的智能體,實現(xiàn)了空間記憶等核心突破,讓機(jī)器人實現(xiàn)了從被動執(zhí)行到主動干活、從執(zhí)行“短視”的簡單任務(wù)到完成長程的復(fù)雜任務(wù)的關(guān)鍵跨越。
傳統(tǒng)機(jī)器人依賴瞬時視覺,“所見即所得”。一旦物體離開機(jī)器人的視野便相當(dāng)于“消失”,場景發(fā)生變化后機(jī)器人也跟著“失憶”了,無法完成復(fù)雜推理與長程任務(wù)。這就很難使其像人一樣干復(fù)雜的活。
直播中,慧思開物Agent(智能體)以真機(jī)實時運(yùn)行的方式,展示了機(jī)器人流暢完成遞水、拿紙巾等任務(wù)。整個過程中,機(jī)器人有了“空間感”。即使物品離開視野,機(jī)器人仍可精準(zhǔn)定位,不再只是處理眼前的工作,還能根據(jù)空間記憶推理出目標(biāo)物體的位置、狀態(tài)與環(huán)境的關(guān)系。
這是因為北京人形機(jī)器人創(chuàng)新中心為其打造了行業(yè)首個全局場景感知與動態(tài)空間記憶系統(tǒng),它配備的“動態(tài)語義地圖”,可以記錄看到的物體類別、顏色、位置等并實時更新,系統(tǒng)還能實現(xiàn)跨時間、跨視角持久記憶。
“根據(jù)實際測試,機(jī)器人在涉及多步移動、感知、抓取等的復(fù)雜多步驟長程任務(wù)中,這套空間記憶完整鏈路的準(zhǔn)確率都能夠穩(wěn)定在100%。”北京人形機(jī)器人創(chuàng)新中心相關(guān)負(fù)責(zé)人解釋,即便在面對視角切換、物體遮擋等常見擾動的影響下,整體任務(wù)完成率仍維持在98%以上。
這意味著,機(jī)器人真正擁有全局空間記憶和常識,在家庭取物、物料分揀、物流整理等場景中,即便視角切換、物體遮擋、環(huán)境變化,依然能穩(wěn)定完成任務(wù)。
現(xiàn)在的機(jī)器人還有個痛點:記不住人、分不清偏好,每次與同一個人交互都像第一次見面,做每一項工作都像第一次做。為此,慧思開物Agent通過一套用戶記憶系統(tǒng),實現(xiàn)擬人化主動交互,讓機(jī)器人可以分辨出來誰是誰,只要見過一次,就能長期記住行為偏好,提供個性化服務(wù)。
比如,用戶隨口說“口渴”時,機(jī)器人通過人臉匹配調(diào)取歷史記憶,識別出用戶偏愛可樂,主動為用戶把可樂取來。它還能讓機(jī)器人具備跨任務(wù)上下文延續(xù)能力。當(dāng)用戶下達(dá)“繼續(xù)做昨天的事”“把上次的文件給我”等跨時間任務(wù),機(jī)器人也能“想”起來。
“正因如此,機(jī)器人還可以自主感知環(huán)境、主動發(fā)現(xiàn)需求,做到眼里有活。”相關(guān)負(fù)責(zé)人說,通過這一技術(shù)的突破和延展,機(jī)器人不再是冰冷的執(zhí)行機(jī)器,而是記得你、理解你、主動服務(wù)你的智能伙伴。
機(jī)器人不僅要眼里有活,還得“手上有數(shù)”。過去,讓機(jī)器人抓取某些物品時,它往往能抓得起來,但抓不好、控不住。為了解決這個行業(yè)難題,慧思開物Agent搭載“視覺+觸覺”的感知能力,能根據(jù)目標(biāo)物品的特性調(diào)節(jié)自己的抓取力度,讓機(jī)器人更有感知、更能理解,最終實現(xiàn)“手上有數(shù)”的效果,日后也能安全、精準(zhǔn)、穩(wěn)定地干活。