人形機器人也要“進校學習”?數(shù)據(jù)采集成必答題
記者 孫燕 鄧浩
7月9日,德馬科技與智元機器人合作建立全球首家具身智能人形機器人物流訓練工廠,部署數(shù)十臺人形機器人開展真實物流場景(搬運、拆箱、分揀等)的數(shù)據(jù)采集與訓練。
此前在6月,合肥市具身智能機器人數(shù)據(jù)采集預訓練場啟用,帕西尼具身智能超級數(shù)據(jù)工廠也投入運營。
數(shù)據(jù)被認為是具身智能的“卡脖子”問題。
東吳證券指出,不同于大語言模型可以使用互聯(lián)網(wǎng)海量信息作為訓練數(shù)據(jù),機器人所用的具身智能模型沒有現(xiàn)成數(shù)據(jù)可以使用,需要投入大量時間和資源進行機器人操作實踐或仿真模擬,以收集視覺、觸覺、力覺、運動軌跡以及機器人本體狀態(tài)等多源異構(gòu)數(shù)據(jù)。
為助力數(shù)據(jù)采集,訓練場應運而生。
企業(yè)、政府爭相落地
去年下半年以來,具身智能數(shù)據(jù)采集廠密集落地。
企業(yè)率先搭建數(shù)據(jù)采集中心,如智元機器人數(shù)據(jù)采集中心于去年9月啟用,帕西尼主導建設的具身智能超級數(shù)據(jù)工廠于今年6月投入運營。
之所以要采集數(shù)據(jù),是因為人形機器人在落地場景之前,需逐步學習并優(yōu)化技能。
通常而言,單個場景的訓練就可能需要百萬量級的數(shù)據(jù),但是行業(yè)早期缺少高質(zhì)量且格式統(tǒng)一的數(shù)據(jù)庫,從而制約了機器人泛化能力的提升。
為了突破數(shù)據(jù)困境,行業(yè)內(nèi)出現(xiàn)了兩種思路。民生證券研究指出,其一,以英偉達、銀河通用為代表的企業(yè)試圖通過仿真數(shù)據(jù)的方式,生成數(shù)據(jù)用于機器人訓練;其二,以智元機器人為代表的企業(yè)建立大規(guī)模數(shù)據(jù)采集廠以收集高質(zhì)量的真實場景數(shù)據(jù),再尋求合適的比例將真實數(shù)據(jù)與仿真數(shù)據(jù)混合,以實現(xiàn)較優(yōu)的訓練效果。
一位產(chǎn)業(yè)人士告訴21世紀經(jīng)濟報道記者,該企業(yè)先在數(shù)采中心搭建工廠實景,依靠人工遙操,讓機器人采集真機數(shù)據(jù),從而訓練出單個工種的小模型(或算法),以達到客戶的交付要求!耙粋項目POC(概念驗證)要兩個月左右時間,要達到較高準確性可能要半年以上。但由于工廠作業(yè)環(huán)境以及其他安全考慮,人形機器人無法一直在現(xiàn)場采集數(shù)據(jù),所以我們根據(jù)制造現(xiàn)場搭建了實景給機器人訓練!
除了廠商自采集,地方政府也在建設數(shù)據(jù)采集中心:國家地方共建人形機器人創(chuàng)新中心建設的全國首個異構(gòu)人形機器人訓練場于今年1月啟用,合肥市具身智能機器人數(shù)據(jù)采集預訓練場于今年6月啟用。
前述產(chǎn)業(yè)人士告訴記者,在G端,主要是工業(yè)、人工智能產(chǎn)業(yè)發(fā)達的地方政府采購人形機器人去建數(shù)采中心。由政府主導建設的數(shù)據(jù)采集中心一般是公共服務平臺,所采集的數(shù)據(jù)歸政府平臺所有,待積累了足夠多的數(shù)據(jù)后,可以提供給轄區(qū)內(nèi)的機器人企業(yè)訓練。
青瞳視覺相關業(yè)務人士對記者表示,該公司從2023年左右開啟了人形機器人數(shù)據(jù)采集業(yè)務!爸饕莟o G和to B,目前在政府端、學校端、企業(yè)端都有落地。”
一套數(shù)據(jù)采集解決方案通常包括機器人、硬件、軟件、云數(shù)據(jù)處理服務、軟硬件售后維護、模型訓練平臺等。據(jù)青瞳視覺相關業(yè)務人士透露,一套數(shù)采中心解決方案售價在40萬-50萬元。
效率有待提高
前述產(chǎn)業(yè)人士指出,目前人形機器人行業(yè)都在做數(shù)據(jù)采集!爸灰菍W⑾掠螒玫钠髽I(yè),哪怕不建大規(guī)模數(shù)采中心,也因為要做POC、交付,會搭建小規(guī)模數(shù)采中心!
其預計,這兩年行業(yè)內(nèi)人形機器人出貨量最多的可能在數(shù)據(jù)采集場景。“工業(yè)場景里幾十臺訂單,量已經(jīng)很大了。但建設一個數(shù)采中心,起碼要到百臺級別,否則經(jīng)濟效益不夠。 ”
但當前,人形機器人數(shù)據(jù)采集仍然面臨挑戰(zhàn)。
一方面,硬件方案未收斂,數(shù)據(jù)孤島問題提高了數(shù)據(jù)采集成本。華源證券研究指出,目前廣義的人形機器人硬件結(jié)構(gòu)尚存在不確定性,例如本體存在輪式方案與雙足方案,手部結(jié)構(gòu)如夾爪、靈巧手、三爪等機械結(jié)構(gòu)尚未確定;傳感器方案中視觸覺、磁變傳感器的方案選擇與具體排布位置也未有定論。
前述產(chǎn)業(yè)人士也指出,人形機器人仍在快速迭代階段:每個星期都會有模組修改,一兩個月就會有零部件、局部改造,可能幾個月到半年就會更新一代。
另一方面,當前人形機器人數(shù)據(jù)采集方法多數(shù)集中在關節(jié)層數(shù)據(jù),如各自由度的角度、速度、力矩等,硬件不統(tǒng)一導致不同機器人關節(jié)結(jié)構(gòu)差異較大,采集的數(shù)據(jù)具有極強的平臺依賴性,可復用性低,數(shù)據(jù)孤島問題極大提高了數(shù)據(jù)采集成本,使得產(chǎn)業(yè)端難以通過規(guī)模化降低數(shù)據(jù)成本。
而本體高自由度的累計傳遞誤差帶來的本體精度問題以及機器人本體-人體自由度不匹配導致映射算法構(gòu)建困難,進而導致真實數(shù)據(jù)采集精度不夠,有效數(shù)據(jù)比例較低。
前述產(chǎn)業(yè)人士指出,不同結(jié)構(gòu)的機器人所采集的數(shù)據(jù),若映射到新的本體上作業(yè),數(shù)據(jù)的準確性、模型的有效性會大打折扣。
但在行業(yè)發(fā)展初期,采集數(shù)據(jù)依然是第一步。
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制及建立鏡像,違者將依法追究法律責任。
[京B2-20230170] [京ICP備17012796號-1]
[互聯(lián)網(wǎng)新聞信息服務許可證10120220005] [互聯(lián)網(wǎng)宗教信息服務許可證:京(2022)0000107]
違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司