门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能产品
›
机器人
›
骑自行车、有情感:稚晖君鸽了两年后的模块化机器人灵犀 ...
返回列表
骑自行车、有情感:稚晖君鸽了两年后的模块化机器人灵犀X2来了
[复制链接]
admin
13 小时前
显示全部楼层
|
阅读模式
2025 年 3 月 11 日,在前一天公布了具身系统研发成果后,被粉丝称为“野生钢铁侠”的稚晖君(本名彭志辉)正式发布了智元机器人的最新力作——灵犀 X2。这位曾经的华为天才少年、2022 年毅然放弃百万年薪创立智元机器人的 90 后科技达人,时隔两年终于再次带来重磅更新,展示了这款集运动、交互、作业三大能力于一体的人形机器人。
(来源:稚晖君社交媒体)
灵犀 X2 体重 33.8 公斤,全身配备 28 个自由度,被智元机器人团队称为“第一台真正具备复杂交互能力的灵动机器人”。这个小家伙融合了三大核心能力:
高自由度运动的双足机器人特性、基于情感计算引擎的智能交互能力,以及具备通用任务执行的具身智能。
在最基础的运动能力上,能够稳稳当当地行走、奔跑和原地转圈、跳科目三、深蹲动作这些不算新鲜的能力自然不在话下,最让我震惊的是它居然还会骑滑板车、平衡车,甚至是自行车。
(来源:稚晖君社交媒体)
交互方面,灵犀 X2 搭载了一套基于 Diffusion 的生成式动作引擎,以及专门训练的多模态交互大模型“硅光动语”(光代表视觉,动代表动作,语代表语音)。这使得 X2 能够实现毫秒级响应的人机交互,能通过视觉识别物体、阅读药品说明书,甚至能理解人类的面部表情和语音语调,做出相应回应。视频中,X2 用稚晖君本人的声音进行对话,聊天时还会配合适当的手部动作,看起来相当自然。当被问到“这些问题有哪些是预先设置的”时,X2 还骄傲地回答
“完全随机”,
颇有些人味儿。
此外,它还具有远程裸眼 3D 交流(看起来有点抽象)、机机(机器人和智能手机)联动等新鲜功能。
(来源:稚晖君社交媒体)
为了展示它的精细操作能力,灵犀 X2 又重现了稚晖君四年前就展示过的绝活“葡萄缝针”。通过开源的数据集和框架,灵犀 X2 已具备简单任务的零样本泛化能力,比如从货架取物。此外,它还能与其他机器人配合工作,例如给同伴充电等任务,展现出其协作潜力。
(来源:稚晖君社交媒体)
为了实现这些能力,灵犀 X2 采用了新的模块化设计理念。它的硬件系统被拆分为一系列可复用的核心组件,包括小脑控制器 Xyber-Edge、域控制器 Xyber-DCU、智能电源管理系统 Xyber-BMS 以及核心关节模组 PowerFlow 等。这种设计让开发者能够像搭积木或无人机航模一样,轻松组装出各种形态的人形机器人系统。这种可模块化拓展的设计,可以使其能力拥有更高的上升空间。除了加速迭代,还能让用户根据自己的需求自由探索,适配康养、服务、家庭陪伴等各类场景。
(来源:稚晖君社交媒体)
关节结构方面,X2 原型机全身 28 个自由度采用了类似人体的串联结构,没有使用任何并联结构,这既保证了惯量上移,又实现了运控算法的完全解耦。用稚晖君的话说,这让 X2 能够像人一样很地晃腿。
运动控制算法是 X2 的另一个亮点。团队放弃了传统的基于模型 (Model-based) 的控制方法,转向学习驱动的强化学习策略,通过深度强化学习与模仿学习相结合,让灵犀 X2 学会了像人一样的运动能力。稚晖君在视频中还展示了 X2 早期训练中的各种“翻车”场面,比如学会了螃蟹式横着走路、跳着往后蹦,或者直接躺地摆烂等。
另外,为了让机器人更有“人情味”,研发团队在动作模态上下足了功夫,赋予机器人呼吸韵律、好奇心和注意力机制等细节,使其举止更加生动自然。未来,智元机器人计划通过 Reaction-Agent 情感计算引擎进一步丰富 X2 的情感表达,让它变得更加“有血有肉”。
而且,除了它的内在,这个机器人的外在也更柔软。在材料选择上,研发团队没有走传统路线,而是尝试了各种柔性材料,包括 TPU、ETPU、EVA,甚至还试过美妆蛋,最终选定了亲和性较高的柔性材料,让机器人摆脱了传统“钢筋铁骨”的冰冷感。作为面向家居场景的机器人,
这种提供情绪价值的设计也的确很有必要。
(来源:稚晖君社交媒体)
在具身智能方面,智元机器人开源了大规模具身真机和仿真数据集,并提出了 RoboDual 大小脑系统架构以及基于 ViLLA 架构的基座大模型“启元”(GO-1)。这一大模型通过融合多模态大模型 (VLM) 与混合专家系统 (MoE),有效突破了传统具身智能在泛化性、跨本体适配性、数据利用率和持续进化机制等方面的瓶颈。
稚晖君表示,灵犀 X2 的能力可以延伸到日常生活的方方面面,实现机器人的“吉祥三保”——保安、保姆、保洁,并同步应用于教育、医疗等多个领域。
“我们的终极期待,是希望机器人能够成为构建社会生产力的重要分母。”
参考资料:
1.https://www.bilibili.com/video/BV1JYRjYoEzE/?spm_id_from=333.788.recommend_more_video.0&vd_source=717deaf214136e4c4fdfc4fea7a67652
运营/排版:何晨龙
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
admin
管理员
0
关注
0
粉丝
7844
帖子
Ta的主页
发布
发消息
加好友
最近发表
家用电器行业观察:传感器技术驱动智能家居升级;格力电器加速门
别再当冤大头!2025最狠智能家居指南:3步省下50%预算,照抄就够
上海并购女王,12亿入局智能家居
京东与小米深化战略合作 目标三年内智能穿戴设备成交额达100亿元
支付宝(杭州)取得一种智能可穿戴设备 NFC 业务处理方法、装置
老板电器市盈率不足14倍 智能家居布局能否打开新成长空间?
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们