仅依靠强化学习,机器狗能当羽毛球搭子了!还涌现出类人回位行为
无需人工协助,仅靠强化学习,机器狗子就学会了羽毛球哐哐对打,就像这样——在室外:在室内:都不在话下。基于强化学习,研究人员开发了机器狗的全身视觉运动控制策略,同步控制腿部(18个自由度)移动,和手臂挥拍动作。最终呈现出来的表现不赖,狗子最高挥拍速度达到12米/秒。在与人类选手的协作比赛中,某一回合...
仅依靠强化学习,机器狗能当羽毛球搭子了!还涌现出类人回位行为
无需人工协助,仅靠强化学习,机器狗子就学会了羽毛球哐哐对打,就像这样—— 在室外: 在室内: 都不在话下。 基于强化学习,研究人员开发了机器狗的全身视觉运动控制策略,同步控制腿部(18个自由度)移动,和手臂挥拍动作。 最终呈现出来的表现不赖,狗子最高挥拍速度达到12米/秒。 在与人类选手的协作比赛中,某一回合...
...苏黎世联邦理工的机器人系统实验室实现了四足机器人打羽毛球...
- 用强化学习训练,涌现出了拟人行为,比如击球后自动返回球场中心,为下一回合做准备。这个事先并没有明确编程,是自然出现的行为。 -机器人学会了根据羽毛球的轨迹自动调整俯仰角度,以确保最好的视野。这个也是自然涌现出来的。 -机器人和人类玩家连续对打 10 次以上成功率 > 85%,对抗发球机的成功率是 94.5%,...
来,看看机器人的“类人生活”(瞰前沿)
凭借类似人手的灵巧结构和先进的控制技术,人形机器人可以完成更多任务,并在多变任务中展现出高度通用性。比如使用螺丝刀、键盘、钻头等常用工具,完成开关阀门、物件装配等精细动作,还能平稳处理易碎物体。这种高度适应能力,使得人形机器人在社会任务中更加得心应手。机器人设计成人形,还能更好地与人社交。它们的类人...
腾讯机器狗再进化 通过深度学习掌握自主决策能力
让机器狗像人和动物一样灵活且稳定的运动,是机器人研究领域长期追求的目标,深度学习技术的不断进步,使得让机器通过“学习”来掌握相关能力,学会应对复杂多变的环境变得可行。引入预训练和强化学习:让机器狗更加灵动 腾讯Robotics X机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的...
机器狗“成精”了!做足球守门员,拦截成功率比人类高18.5%
分层次的强化学习框架可以直接将四足机器人在模拟中学习到的动态动作和守门员的技能转移到现实中的四足机器人上,实验中的四足机器人对随机射门的成功拦截率为87.5%,而人类足球运动员的平均成功率为69%。三、多技能组合促四足机器人快速动态反应 因为球的弹道总时间通常在1秒以内,所以四足机器人需要快速反应。从球门...
攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了
这串动作说明机器狗掌握了贴地爬行、攀爬和跳跃三个基本技能:它还有个技能:倾斜挤过窄缝:如果机器狗未能克服障碍,它会多试几次:该机器狗是基于一种为低成本机器人研发的「跑酷」技能学习框架。这个框架是由来自上海期智研究院、斯坦福大学、上海科技大学、CMU 和清华大学的研究者联合提出的,研究论文已经入选 ...
强化学习让机器具备自己学习的能力,人类怎么办?
这是一种基于与环境互动的目标导向的机器学习。在强化学习中,算法要自行作出决策,它并不需要依靠历史数据,只需要理解当前场景就足够。通过与当前场景互动,算法所做出的决策的相关性会逐渐增强,就像一个人一步步经历其各个学习阶段不断成长一样,这便是它的“过人之处”——没有懒惰与懈怠,在算法下可以在环境中持之...
机器狗跑酷新突破:卡内基梅隆大学的研究成果解析
本研究采用了一种创新的端到端数据驱动强化学习策略,赋予了机器狗出色的「跑酷」能力。为使机器狗在面对不同障碍时能自适应调整,我们引入了一种独特的双重蒸馏技术。此技术不仅使得机器狗能执行流畅的运动指令,还能迅速响应深度图像的输入,从而灵活调整运动方向。2.2 ▍ 实验设计与结果 为了使单个神经网络能够...
在人工智能世界,机器狗成长更快近日... 来自中国科学报 - 微博
研究发现,尽管在训练过程中机器狗始终无法“看到”真实世界,但在经过人工智能强化训练后,机器狗在88%的时间内都能成功追逐真实世界中的球并翻越物体。而当机器狗完全依赖人的训练时,成功率只有15%。这种训练捷径最终可以消除基于人指导的学习障碍,同时还能提高准确性。O网页链接 ...
陪练机器人来了,你打得过那个AI么?-机器人设计-爱企查企业服务平台
AI需要接收和处理的信息数量与发球机相比根本不是一量级,由于陪练机器人在多个领域还存在技术障碍,这也使得陪练机器人在短时间内还无法战胜的人类。 1、陪练机器人应用场景、使用条件均有有限制 需要承认的是,体育运动领域对于AI来说是一个巨大的蓝海,但是直到目前,AI陪练机器人仅仅只在乒乓球和羽毛球这两个项目中...
独木桥、跳隔板、钻洞穴……百度强化学习新算法给机器狗装上新...
这颗新“大脑”里,最关键的部位叫基于自进化步态生成器的强化学习框架——简单来说就是让机器狗分两步走: 第一步,机器狗能高效地通过“进化”的方式学习出自己的行动沿着什么轨迹走最合理,面对不同的环境要学习合适的“走法”。 第二步就要加上强化学习了,当机器狗在面对当前情况时使用了灵活的方式通过时,就...
机器狗能跑能跳,还能当守门员 - 知乎
用脚试试,机器狗也能把球门守的死死的 0 有趣的是,该研究还尝试让一只机器狗踢球,另一只当守门员,两只机器狗自己也能玩挺好: 0 看完效果,感觉机器狗当守门员还挺靠谱。这款机器狗是 MIT 在 2019 年研发的 Mini Cheetah,现在来自加州大学伯克利分校等机构的研究者为 Mini Cheetah 部署了一个新的强化学习框架...
...Mini cheetah机器狗设计(四十二)】强化学习-基于策略的迷宫游戏...
【导读】为什么强化学习有可能实现类人的人工智能?举两个例子: 1、当一个孩子学习骑自行车时,并没有人去教其诸如牛顿力学等力学法则以及如何骑车的详细方法,也不必通过观看视频来学习骑自行车。事实上,自己尝试骑自行车,在多次失败的过程中找到一种骑自行车的方法。强化学习正如学骑自行车的例子,它是一种学习方法,它...
实验室来了个会“思考”的机器狗
当机器狗首次进入商场地下车库,面对陌生的斜坡、立柱和通风管道,它能结合“白色帽子”“金属货架”等语义信息提示进行自主推理,甚至能够预判目标物——饮料瓶可能出现的位置。这种类人化的思维能力,源于大模型与语义标注技术的融合——工程师们将人类的生活经验“翻译”成机器能理解的代码。眼下,这只机器狗还只是...
让机器狗自己学会如何抵御人类的攻击
他们开发了具有八种算法的学习体系,以帮助机器狗产生复杂的行为。对于每种算法,都使用深度神经网络来训练机器人的计算机模型以实现特定技能,例如小跑或如果摔倒了重新站立起来。如果虚拟机器人的尝试更接近目标,它将会获得数字形式的奖励。如果它做了一些不理想的事情,那就...
用世界模型训练机器狗:1小时学会走路、翻身和通过障碍物
在机器狗学会走路后,它还可以学会适应其他不可预测的结果,比如被研究人员用棍子戳倒。强化学习已经使机器人在棋类和电子游戏等方面大大超过了人类,但教会机器人在现实世界中做出正确的行动依然极具挑战性。归根结底,这是因为工程师们必须根据科学家是否希望这种行为得到奖励来进行编程。“将强化学习应用到实体机器人...
湄洲日报数字报-机器狗通过深度学习“进化”
据新华网报道,近日,腾讯Robotics X机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,让机器狗Max的灵活性和自主决策能力得到大幅提升。 @风筝:通过深度学习,让机器狗像人和动物一样灵活且稳定地运动,将为人类探索更多未知世界。
受鸟类启发:上海交通大学开发新型生物混合扑翼机器人
近日上海交通大学海洋与土木工程学院工程力学系、海洋工程国家重点实验室以及上海交通大学机械工程学院机械系统与振动国家重点实验室开发团队联合打造了一款羽毛-压电生物混合感知方法的扑翼机器人,该机器人具备环境感知和自主飞行能力,不仅具有轻量化、高灵敏度...
腾讯用预训练模型和强化学习提升机器狗控制-36氪
腾讯用预训练模型和强化学习提升机器狗控制 腾讯Robotics X机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,让机器狗 Max 的灵活性和自主决策能力得到大幅提升。