门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能产品
›
机器人
›
国家队出手,通用人形机器人打响第一枪 | 钛媒体焦点 ...
返回列表
国家队出手,通用人形机器人打响第一枪 | 钛媒体焦点
[复制链接]
tuofapl
3 天前
显示全部楼层
|
阅读模式
人形机器人距离下场干活,又往前迈进了一步。
3月12日,北京人形机器人创新中心对外发布了首个“一脑多能”、“一脑多机”的通用具身智能平台“慧思开物”。通过该平台,这家公司试图将人形机器人的通用化能力拆解成单个的技能模块,通过组合这些技能模块,让通用人形机器人的开发门槛大幅降低,并且还能让不同形态的机器人也能适配这些能力。
“具身智能在‘智能化’方面仍处于初级阶段,行业亟需一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。为了替具身智能产业补上通用软件系统这块重要拼图,创新中心研发了全球首个支持多本体多场景应用的通用具身智能平台‘慧思开物’。”
创新中心总经理熊友军表示,在“慧思开物”的支持下,优必选在全球范围内首次把群脑网络(BrainNet)用于人形机器人执行整条产线的工业级任务。
AI大模型+元技能库,组建“大脑”与“小脑”
具体而言,“慧思开物”由AI大模型驱动的任务规划“大脑”以及数据驱动的端到端技能执行具身“小脑”构成。
其中,“大脑”具备自然交互、空间感知、意图理解、分层规划和错误反思等能力,“小脑”分为具身操作和具身运控两个子平台:具身操作涵盖元技能库、泛化抓取、技能拆解和错误处理等功能,而具身运控负责实现全身控制、双臂协作、稳定行走和移动导航等任务。
由具身“大脑”进行任务规划,再调用具身“小脑”技能库执行具体动作,并将执行反馈传递给具身“大脑”,形成任务闭环。
基于高效协同的具身“大脑”与具身“小脑”架构,“慧思开物”可以精准解析自然语言交互指令,通过多模态信息融合与上下文理解,将复杂任务分解为可执行的子任务序列,并在任务执行过程中实时监测状态,通过自适应纠错机制和动态路径规划,确保任务的高效推进与准确完成。
同时,“慧思开物”内置多场景适配引擎,支持从工业制造到家庭服务等多种场景,结合高效的资源调度与并行计算能力,能够精准满足特定场景下的工作节拍与精度标准,为机器人在复杂场景的应用提供可靠的技术保障。
“现在慧思开物的技能库中已经具备了30多种技能,可以覆盖大部分的任务类型。”创新中心CTO唐剑表示,整个端侧运动控制的输出功率为200赫兹,可以让机器人的整个运动非常平滑。
而在人形机器人的数据训练方面,目前业界主流的训练方式有两种。其一,是让机器人在仿真环境中训练,然后将训练结果迁移到真实环境中;其二,则是让机器人直接在真实环境中训练,根据真实环境的训练过程进行AI的直接调教。
宇树科技创始人曾向钛媒体表示,随着端到端的AI模型进一步完善,仿真数据对于人形机器人将不再重要。而在与创新中心的交流中,唐剑则向钛媒体表示,他们更倾向于虚实结合的数据训练方式。
“我们一贯坚持虚实结合的训练,才能达到最好的效果。”唐剑称,在虚拟环境中能够非常好地去泛化和随机化场景,比如改变环境光线、物体形状、颜色等。而在实际场景中,这些多样性并不容易实现。
根据创新中心提供的数据,当混合数据比例达到真机数据:仿真数据为100:400时,机器人的执行成功率接近100%。
距离“下场干活”,越来越近
基于虚实结合的训练模式和以技能库为核心的运动执行方式,“慧思开物”此次也展示了工业分拣、积木搭建、桌面清理和物流打包四个场景的真机操作。通过语音交互、APP直连等多种方式,用户能够与机器人自然交互,并通过模糊指令让机器人完成操作任务。
在工业分拣任务中,通过“慧思开物”APP直连,UR-5e机械臂能够精准解析语音指令,将复杂的技术能力(如推理、规划、技能调用)封装为简单易用的操作流程,并通过双臂协同的方式完成分拣操作,显著降低了用户使用门槛。
同时,平台支持自定义模型和技能的快速添加,能够灵活适配不同场景的应用需求,为工业自动化领域提供便捷、高效的解决方案。
在积木搭建中,“慧思开物”通过大模型思维链能力,首次实现了复杂任务的智能化拆解与执行。基于随机搭建的积木样例,“天工”利用视觉大模型(VLM)对样例进行拆解,精确规划每一层的搭建顺序,准确拾取相应积木,并按次序完成了3层积木的毫米级精准搭建。
在桌面清理场景中,人形机器人“天工”展现了双臂协作的高效性与动态环境下的自适应能力,流畅地整理桌面餐具,将垃圾收进锡纸盘并放入垃圾桶。整个过程中,机器人在多次任意随机的人为打断和移位干扰的情况下,仍能自主纠错、重新规划并完成任务。
在物流打包场景,基于“慧思开物”平台,“天工PRO”首次实现了全尺寸人形机器人物流打包全流程的自主作业。
通过上半身29个自由度的配合,“天工PRO”使用左右手分别拿起物品和扫码枪,通过头部相机确认物品条形码位置,双手协同完成扫码、装箱、封箱及粘贴快递标签等一系列操作。
“目前,创新中心正在将这些能力逐步实现商业化落地。”唐剑称,现在主要探索的方向为教育科研、健康养老、特种作业以及工业制造。
(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
2
农夫花园
前天 07:09
显示全部楼层
加油!不要理那些键盘侠!
回复
使用道具
举报
好肚量醉鹅
3 小时前
显示全部楼层
这帖子写的不错
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
tuofapl
注册会员
0
关注
0
粉丝
19
帖子
Ta的主页
发布
发消息
加好友
最近发表
要去迪士尼的稍微再等等:英伟达的机器人马上能在园区满地跑了
从战场到赛场,均有出现的中国大疆无人机,为何我国军队却不用?
2025年中国智能可穿戴设备产业链梳理及投资热力地图
上海并购女王,12亿入局智能家居
京东与小米深化战略合作 目标三年内智能穿戴设备成交额达100亿元
支付宝(杭州)取得一种智能可穿戴设备 NFC 业务处理方法、装置
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们