北京研发团队展示连续后空翻人形机器人N2,技术创新提升稳定性
在过去的两天中,人形机器人的技能再次得到提高。北京的机器人研究和开发团队显示,人形机器人可以不断反转。
CCTV记者Zhang Chunling:机器人再次迭代!我旁边是一个相对较短的人形机器人,只有1.3米高。它刚刚实现了连续反弹的多个困难动作。它的名称是N2。
该团队技术总监江口(Jiang Zheyuan):与Frontflips相比,背板的困难是,人们通常比Frontflips短。当它们是反弹时,根据惯性,它们更容易倒退。如果后空流较短,则更容易抬起。如果前流较短,则将其更长且较小的抬高可能性。因此,反弹会比以前更加困难。
为了达到机器人的后置稳定性,该团队在硬件结构中进行了创新的设计。他们将重型关节尽可能地集中在co骨上,以便机器人可以在翻转过程中最小化强度。同时,他们使用更强大的电动机和较轻的材料为机器人提供更大的爆炸能力。
如何在三个星期内学习反弹式机器人?
尽管反弹很困难,但记者在采访中获悉,机器人团队只花了三个星期就让机器人学习了这一特殊技能。
问题是:如何让机器人学习反弹?需要多少个步骤?
首先,在数字世界中,团队通过一系列动态计算优化获得了翻筋斗的最佳轨迹。
然后,在虚拟仿真中,他们使用加固学习方法来允许数百个机器人模仿这种翻译的最佳轨迹,并不断尝试犯错。
由于背面流动是一个相对困难的动作,因此团队还为训练添加了课程学习方法,使机器人能够从轻松到困难完成准确的轨迹复制品,就像一个人上课一样。
然后,训练有素的算法被迁移到机器人体,通过连续重复测试,在模拟世界和真实机器人中连续进行了系统优化,以便真正的机器人也可以复制反向反弹。
团队算法工程师Li Shengtao:我们给它一些奖励以跟踪关节角度。如果它跳高或较短,我们将对其进行一些惩罚。通过这组方法,然后使其不断拟合专家数据。
专家介绍,无论是攀登步骤,反弹,甚至采取了一些更困难的行动,最近都无法将“武术秘密”变得更强大,无法与称为“增强学习”的人工智能学习范式分开。它允许机器人“通过为机器人标准化,在一个未知的数字世界中像人类这样的人像人类一样增长”。它允许机器人通过“反复试验”和“惩罚”独立发展。
北京类人机器人创新中心首席技术官Tang Jian:强化学习有一个很大的问题,也就是说,培训很困难。如果是新手,那么机器人可能会在真实的环境中进行培训,并会受到损坏,因为它通常会做出一些错误的操作并且会失败。要在虚拟环境中进行训练,虚拟环境和真实环境中可能会出现错误。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。