找回密码
 立即注册
搜索

焦点分析|看起来酷炫的人形机器人,距离进厂拧螺丝还有很远

作者丨常敏潇

编辑丨邱晓芬、苏建勋

在2024的WAIC大会上,花样层出的人形机器人无疑成为全场最大的亮点。

在进入会场之前,WAIC主办方专门设置了一个展台,放了18台当下炙手可热的人形机器人“先锋矩阵”,上拉横幅,“十八金刚,众创未来”。

在H1馆,这次参展的机器人相关企业多达45家,为了吸引眼球,各家的机器人都秀出了真功夫——

「宇树科技」的机器狗在展台上一下又一下后空翻,引得台下观众惊呼连连;「逐际动力」的动力双足机器人,为了展示耐用性,沦为了观众们的“泄愤工具”,在一轮轮的猛烈踢踹下,依然坚挺。



「宇树科技」机器狗 图源:作者拍摄

特斯拉机器人Optimus二代,在被马斯克官宣七个月后的首次展出,自然成为全场焦点之一。可惜的是,Optimus这次被封在了玻璃里,但这也挡不住展柜前的人头攒动,观众们纷纷拿出手机和它合影留恋。

据《智能涌现》作者了解,参展的人形机器人达25款之多。不过,大家在玩够了之后,也沉淀了一些冷思考。

在WAIC展会中,宇树、达闼等多个人形机器人的展台旁,不少观众们的问题出奇一致——“它(人形机器人)的主要应用场景是什么?可以做哪些工作?”

人形机器人,长了脑子


具身智能(Embodied AI),指的是机器通过感知交互,像人一样感知周围环境变化并作出相应反应,具备敏锐而灵活的感官。

在没有AI充当机器人的智慧“大脑”之前,机器人的躯壳无法与周围环境互动,更谈不上感知、理解世界。

而这次的WAIC上,这波人形机器人最大的特点是,都“长脑子”了——酷炫的外表内,各家基本都装上了AI驱动的多模态大模型大脑。具体的表现是,这些人形机器人都能敏锐得对现实环境进行捕捉,看见、理解物理世界中的事物。

在此次WAIC中,「跨维智能」的机器人展示了对不同形状和重量物品的识别和抓取能力。

据介绍,「跨维智能」的机器人支持多模态机动、感知、交互和操作,具备拟人化的运动控制能力。在此前抓取桌面随意摆放的物品的基础上,该机器人可以在人们打碎玻璃杯后,准确抓取形态各异、不规则曲面且带反光的玻璃碎片,体现了人形机器人对随机状况的判断和应变能力。

具身智能公司「穹彻智能」,则推出了穹彻具身大脑Noematrix Brain,在完全开放的场域中,Noematrix Brain展示了叠衣服和削黄瓜。

这些看起来日常的动作,却隐含了很多的随机性和不确定性。比如,展台现场的工作人员将衣服随手一丢,机器人就能马上找到衣服的衣角,边对边、角对角,整齐的叠起来摆在一旁。



「穹彻智能」灵巧手 图源:作者拍摄

在现场,工作人员不间断的给机器人多个大小不一、长短各异的黄瓜。机器人都能准确判断黄瓜的曲面形态,一只“手”抓起,另一只“手”快速削皮。这无疑需要机器人拥有堪比人类的对复杂、不规则事物的理解程度。

想让人形机器人从实验室真正的走进生活,在更多的商业化场景中得到应用,机器人就需要有更成熟的大脑,以承担更高算力的工作,以具备在现实生活中的自主学习和适应能力。

在WAIC论坛中,「宇树科技」CEO王兴兴也表示,对于具身智能而言,能够理解时间、空间以及物理规律的世界模型非常重要。

从象牙塔,到进工厂“拧螺丝”


尽管WAIC上展台的机器人热闹非凡,聪明程度也比去年提升了不少,但人形机器人的应用场景依旧有限。

「傅立叶」、「逐际动力」等多个机器人厂商工作人员告诉《智能涌现》,人形机器人目前依旧面临技能库相对单一、应用数据较为片面等现实问题,难以在有多重干扰、相对随机的现实生活中实现大规模投放。

《智能涌现》了解到,目前大部分主流人形机器人厂商,出货渠道还是以学校和科研所为主。不过,行业中也在尝试走出象牙塔,工厂是人形机器人厂商们瞄准的第一片星辰大海。

比如,在 WAIC上,特斯拉二代人形机器人Optimus就尝试往工厂去落地,特斯拉的动作也相当激进。

根据特斯拉方面介绍,他们的Optimus在短短一年的时间内,已经进化出了感知和触觉——举个例子,Optimus已经能够分辨他们手里拿的是50克的鸡蛋还是一百斤的石头。

此外,特斯拉还把用在车上的视觉神经网络和FSD芯片,放到了Optimus身上,让机器人也能模仿人类对电池进行分拣训练。根据特斯拉方面的设想,大概会有1000个Optimus,会进工厂搬运、分拣电池了。

此外,此前机器人厂商「优必选」也尝试与一汽-大众达成合作,引入工业版人形机器人Walker S,开展汽车制造过程中的螺栓拧紧、零件安装、零件转运等工作。



「优必选」人形机器人Walker S

让人类从重复性高、环境恶劣的工厂解放出来,是人形机器人走出象牙塔之后的第一个重要场景,也是它们重要的使命。

不过,当人形机器人要真正走向人类世界,难题还有很多。

多名人形机器人展台工作人员告诉《智能涌现》,人形机器人的落地需要有两套数据来打底——物理世界的模型和机器人行为模型。

这两套模型的实际落地各有难度。物理世界的数据庞杂且烦琐,要让机器人习得,不仅需要丰富的数据源,要准确完成动捕也需要更长的训练时间。

在多模态大模型的控制下,机器人现在虽能完成更复杂的动作,但距离完全融入日常生活、取代繁琐人力劳动仍需要时间。人与机器在同一场域出现,给人形机器人的正常运作带来了更多的随机性和不可控因素,进而使人形机器人在面对非结构化场景时仍无法还无法做到随机应变。

成本也是一个巨大的桎梏。

据《智能涌现》作者了解,「达闼机器人」报价39.9万元起、「天链机器人」价格在50万-100万元之间、宇树H1单台售价约65万元、「乐聚公司」的“夸父”机器人单价达60-80万元。

还在起步阶段的人形机器人仍极高的研发成本和较长的研发周期,在没有实现规模化投产之前,大多人形机器人厂商依然不具备强有力的盈利能力。

根据《2024年中国人形机器人行业研究报告》,人形机器人按量产规模不同,降本大致可划分为三个阶段:小批量千台量级生产,降本20%~30%至约10万美元;万台级别降本50%至5万美元;数十万至百万台大规模量产,降本70%~80%至2万~3万美元。

此外,具备交互功能和感知能力的机器人,需要装备完全的大脑、小脑,这都提高了机器人的生产成本。而这背后所支持的芯片,依然无法实现100%国产。

「本末」在内的多个人形机器人厂商告知《智能涌现》,产品的芯片依然依赖于英伟达的进口,“我们能做到90%以上的零部件依靠国产,目前正在和华为探讨接下来的合作,希望后续能做到100%国产”,人形机器人研发公司「星动纪元」的相关负责人透露。

随着马斯克宣布批量生产Optimus机器人,及多家企业爆发式涌入人形机器人行业,不少机构和资方将2024视为人形机器人量产元年。

然而,根据WAIC现场来看,因技术、价格等限制,人形机器人的商业化落地仍处于瓶颈期。

36氪制图



36氪制图

end

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies