歡迎關注“新浪科技”的微信訂閱號:techsina
文/夢晨 韓智
來源:量子位(ID:QbitAI)
什么?小米發布了全尺寸仿生人形機器人?
就在雷軍在個人年度演講快結束時,順手扔出了這個王炸——全尺寸仿生人形機器人CyberOne。
并且這次不是PPT,也不是請人穿著道具上去跳舞,而是直接拿出原型機,現場和雷軍互動了一番。
近些年,機器人儼然成為眾多科技公司展現自己綜合研發實力最好的產品。
從早年的波士頓動力、軟銀Pepper,到去年馬斯克的一手‘快閃’,每次發布都引來無數關注——
小米這臺CyberOne與其他家有什么區別?這個雷總的新寵到底有多少技術含金量?
老規矩,更多軟硬件細節及幕后信息,一并為大家揭秘。
小米人形機器人,究竟是個啥?
縱觀當下叫得上號的“網紅”人形機器人,我們不難發現,各家公司對于人形機器人的描摹有很大差異。
按產品定位大致可以分為三個方向。
超越人,以大名鼎鼎的波士頓動力為代表,旨在追求極致機能以達到擁有超越人類的運動能力。
這個方向也吸引了國內外眾多科研單位參與。可以說波士頓動力在姿態控制、動作預判算法、動力輸出等領域走在了全球人形機器人領域的前列。
替代人,以去年宣布打造人形機器人的特斯拉為代表。
馬斯克是個明白人,特斯拉出貨量穩步提高,光超級工廠就規劃了不下10個,如果能打造一個人形機器人來代替工廠中重復勞動的員工,只要綜合成本低過員工工資,就是筆好生意。所以馬老板也絲毫不掩飾他想通過人形機器人替代人的想法。
服務人,這是小米CyberOne選擇的方向。
具體來說,是依托人形更好的研究人感知、認知、決策、執行過程從而更好服務于人。
這一定位方向,在產品細節上如何體現?我們一項一項看。
如果給CyberOne來個外科體檢,高177cm,是一個標準的成年人身高。
體重則僅為52kg,別看現在身板有點單薄,其實也是為了后續進一步演進做重量冗余。
再查五官科,CyberOne的臉蛋沒走擬真的精致五官路線。
頭部前面是個面罩,外層半透明材質,內層為OLED與柔光特效,再加上2D彎曲貼合顯示模組實時表達機器人情緒。
下一項該考察機器人的運動能力。
這其中,關節是核心,業內皆知,這塊相關組件一般占人形機器人成本三分之一以上。
以CyberOne上肢關節電機為例,小米自研了一枚重量僅為500g,額定輸出扭矩高達30N·m的高效電機,保證上肢靈活性。
CyberOne髖關節主要電機瞬時峰值扭矩可達300N·m,配合自研的人形雙足控制算法,行走姿態更加平穩。
再有就是‘手’了,CyberOne單手垂直抓握物體重量為1.5kg。
總體來看,極致運動能力非CyberOne的目標。
CyberOne更多的采用了以高性能、小型化電機為主的干系統作為運動能力支撐,并沒有過多的使用機械性能當下更強大的液壓濕系統。
這種選擇上的傾向還是較為激進的,迎合了新能源時代下例如智能汽車從濕系統逐步替換成干系統的大趨勢。
傳感器方面,CyberOne對外界信息獲取來自聽覺和視覺。
深度相機配合AI相機幫助機器人收入真實場景和物體,通過CV算法獲得物體三維模型實現避障,自帶小米傳統藝能‘萬物追焦’技術,讓CyberOne能夠集中注意力看關鍵物體。
聽覺傳感器配合音頻算法可識別6類45種人類情緒語音,外加85種環境音識別。
你大概好奇環境音識別有什么用?小米工程師舉了一個有趣的例子——
離家前忘關水龍頭?它就能識別滋滋水流聲并提醒你。
據了解,CyberOne還實現了‘拖動示教學習’這項特別的功能。
所謂拖動示教學習,就像是父母手把手教你第一次學會用上了筷子。
這動作對人來說簡單,但對機器就難度很大了。不僅要求硬件機械臂是‘活’的,可被移動,反驅的形式對關鍵部位電機性能要求更高,也是小米團隊最初要求的關鍵指標。
除此之外,機器人還要通過傳感器和軟件層能夠記憶學習動作,重復執行,工程師們希望通過該功能實現,讓機器人模擬人的學習過程。
看到這,大致能得出些不吹不黑的結論——
小米新發布這個人形機器人的確挺像樣,不僅外觀,其各方面組件的確滿足人形機器人要求。
無論行動速度,還是抓握力,再到突出的交互能力和AI算法對環境語義的識別判斷,能看出這臺CyberOne更面向/服務于人本身。
不管怎么說,小米居然不聲不響,閃亮登場一個全尺寸人形仿生機器人,還是出乎了所有人意料。
人形機器人,有多難?
人形是解決綜合問題最高效的形態之一,是機器人領域公認的終極方向,同時也是技術難度最大、需要投入最多的。
毫不夸張的說,全尺寸人形仿生機器人是“機器人皇冠上的明珠”。
原因也不難理解。
身體結構上,人類雙足直立行走、雙手操作工具都是歷經上百萬年進化而來,靠的可是自然選擇的力量。
想用完全不同于生物的一套材料、靠人為設計去模仿逼近,工程難度可見一斑。
行為和決策上,人形機器人要做到和人一樣、解決復雜問題問題,這就就需要做到對環境的全面理解,需要多模態結合的推理和交互,除了視覺、聽覺,還要考慮更不成熟的嗅覺、觸覺等。
最后還有點現實原因,人形機器人行業還沒有機器狗那么成熟,不要說開源方案了,連論文都沒有幾篇可以參考。
小米人形機器人項目的負責人向迪昀表示,這次難度和去年的機器狗鐵蛋不在一個level上。
看上去理論似乎很健全,但怎么做、技術如何演進,誰也沒有正確答案。
縱觀目前市面上成熟的項目,從產品迭代路線來看大概能分4步:先做下半身站立,到下半身行走,組裝上半身,最后是全身的動作協同。
小米則通過在智能制造和之前CyberDog機器狗項目上的技術積累,最終決定下半身和上半身并行推進,項目進展較快。
機械方面對應人類行為的執行部分,一般由小腦控制。但如果只做到擬人運動能力,充其量可以稱之為機器。
只有擁有了感知-認知-執行的大腦能力,才真的稱得上機器人。而大腦能力也是仿生人形機器人的技術制高點。
從已公開的信息來看,CyberOne首先擁有空間感知、認知能力。
CyberOne搭載自研Mi-Sense深度視覺模組,結合AI交互算法,使其不僅擁有完整的三維空間感知能力,更能夠實現人物身份識別、手勢識別、表情識別,CyberOne真正做到了不僅看得到也能看得懂。
但相比于機器狗,人的世界中信息量級堪稱爆炸。就以簡單的路徑規劃為例,目前最全面、技術難度最高的路徑規劃為自動駕駛路徑規劃。
智能汽車路徑規劃除了解決機器人從A點到B點外,還需要在過程中針對各種情況進行語義標定,例如停止的障礙車輛、地上的行車線、運動中的行人等等,從而對其作出預判,保證安全舒適行車。
雖然CyberOne得到了來自小米自動駕駛團隊的技術幫助,但自動駕駛仍然是在道路交通有限場景下的路徑規劃技術,而人形機器人則是全場景的路徑規劃,面對的情況更加豐富,需要對環境語義的標定更加復雜。
CyberOne同樣擁有情緒的感知和認知能力,這部分能力則是師承小米內部小愛同學團隊。
小米人形機器人項目的負責人向迪昀表示,小愛同學面向大眾展現的能力只是冰山一角,其實小愛團隊很早就開始搭建情緒訓練模型和環境語音語義模型,這方面技術對軟硬件平臺要求較高,尚未開放給大眾用戶,而讓CyberOne搶了“首發”。
解決了諸如上述的各類問題后,CyberOne有了基本的感知、決策、運動和交互能力,可以算是大小腦平衡發展了,所以這次發布會上雷總把他帶上臺進行了演示。
CyberOne和所有的人形仿生機器人一樣,都是處在持續演進過程中。
接下來一段時間,CyberOne還需要改進的地方有很多,硬件上比如完善手指靈活性、學著像人一樣使用工具,軟件的架構也需要整合,從分布式迭代固化為集成式,智能算法更是需要持續迭代改進等。
不過擺在機器人行業面前的問題,從來就不局限于技術本身。
人形機器人投入成本高、回報周期長,商業化進展上這幾年也經歷了一番波折。
波士頓動力公司7年內被3次轉手,產品上機器狗Spot公布的銷量只有數百臺,人形機器人Atlas就要更少。
軟銀的人形機器人Pepper則在去年被曝出直接停產。
總之,邁過技術驗證階段之后,小米想要把機器人打造成一款產品推向市場還有很長的路要走。
既然如此之難,小米為何要做?
在外界看來,小米新技術研發更值得投入精力的地方,似乎應該是造車。
分出人力物力來搞這么難的人形機器人,是出于什么考慮?
對于這個問題,小米給出的答案是CyberOne并不是規劃而來的。
他更像是人,是小米“科技生態”自然進化而來的產物,也是小米科技生態的代言人,可分為兩個方面來看。
第一是技術方面。
小米自成立以來,從智能手機出發,到可穿戴設備、智能家居,再到智能制造、智能電動汽車以及仿生機器人,貫穿其中的是一套不斷融合進化的技術體系。
融合進化,說的是看似已成熟的技術用在新的領域就會暴露出新的問題,然后才有機會做出改進。
舉例來說,機器人自身可以移動,對視覺、語音算法的要求就和手機完全不同。這也印證了AI學術界最近呼聲很高的”具身智能”——給AI一個身體,它理解這個世界的方式才能更貼近人類。
進一步來說,通過融合創新和改進的技術還可以在科技生態內的各個場景相互遷移。
如最初用在機器狗上的萬物追焦算法也能用于手機;小米自動駕駛進展非常快,得益于2017年創辦的小米人工智能實驗室;未來人形機器人上驗證成熟的技術也有機會支援造車。
正如小米機器狗項目發起人去年說過的,”手機就是沒有腿的機器人,機器狗有腿但不需要顯示屏,汽車則是四輪機器人”。
第二個是場景方面。
如果簡單粗暴的將人的行為分為四個狀態:居家生活、工作辦公、交通出行、睡眠休息。那么一個好的商業模型應該盡可能多的覆蓋人的四個狀態,并且越了解四個狀態中用戶不同的需求,從而提供更好的服務,那么這個商業模型的價值就越高。
小米目前提供的服務恰好對這四種狀態全覆蓋,前面也提到,人形機器人目前有三種發展方向。
一種是‘超越人’,以波士頓動力為代表,專注提升機器人的運動性能。
一種是‘替代人’,以特斯拉為代表,要讓機器人進入造車工廠補充勞動力。
小米選擇的是第三種‘服務人’,要圍繞人的生活和工作,更好為人服務,緊密連接人和萬物。
從這個角度看,小米的科技生態在理解人方面有著得天獨厚的優勢。
原研哉在為小米設計全新LOGO的時候,就提到全新的小米LOGO能夠體現小米的品牌精神:科技就越是進化,就越接近生命的形態。如此看來,小米能夠率先推出仿生機器人也是順理成章。
關于機器人如此之難,為何還要做,國家也給出了相關答案。
在工信部等十五部門聯合印發《“十四五”機器人產業發展規劃》中提到:
面向制造業、采礦業、建筑業、農業等行業,以及家庭服務、公共服務、醫療健康、養老助殘、特殊環境作業等領域需求,集聚優勢資源,重點推進工業機器人、服務機器人、特種機器人重點產品的研制及應用,拓展機器人產品系列,提升性能、質量和安全性,推動產品高端化智能化發展。
……
看了這么多,最后不妨一起來聊聊,你覺得人形機器人離廣泛來到人們身邊還有多遠?
超越人、代替人、服務人這三種路線,你又更期待哪個?
(聲明:本文僅代表作者觀點,不代表新浪網立場。)