英伟达最新AI AgentEureka开源 可完成转笔等复杂动作
要点:
英伟达的最新AI AgentEureka使用GPT-4生成奖励函数,教会机器人完成多项复杂任务,包括转笔、打开抽屉、抛球等,表现超越人类专家。
Eureka采用混合梯度架构,结合无梯度的情境学习和强化学习,通过上下文来实现人类水平的奖励算法设计,大幅提升机器人性能。
这项研究受到广泛关注,开源项目可在机器人领域应用,尤其在处理复杂任务和高维电机控制方面表现出色,甚至有时与人类策略负相关。
英伟达最新的AI AgentEureka搭载了强大的GPT-4模型,通过生成奖励函数的方式,使机器人能够完成多项复杂任务,其中包括一些看似简单但难以实现的动作,如转笔、打开抽屉、抛球等。这一成就令人瞩目,尤其是在转笔这项技能上,即便是靠人类逐帧制作动画,也难以达到如此高水准。研究结果显示,Eureka在超过80%的任务中都超越了人类专家,使机器人的平均性能提升了50%以上。
论文链接:
https://arxiv.org/abs/2310.12931
GitHub链接:
https://github.com/eureka-research/Eureka
Eureka的关键创新在于采用了一种混合梯度架构,结合了无梯度的情境学习和强化学习。这个系统使用GPT-4的零样本生成、代码编写以及上下文改进功能,对奖励执行策略进行优化。在外循环中,GPT-4细化奖励函数,而内循环则使用强化学习来训练机器人控制器。这种方法让机器人能够通过强化学习来掌握复杂的技能,而不需要特定的提示工程和奖励模版。
Eureka还支持一种新形式的上下文强化学习,它能够将人类操作员的反馈融入自然语言中,以引导和调整奖励功能。在对29种不同的开源RL环境进行基准测试时,Eureka在83%的测试中超越了人类,并实现了52%的改进。这些测试环境包括10种不同的机器人形态,如四足机器人、四旋翼机器人、双足机器人和机械手等。
最令人惊讶的是,Eureka在处理复杂、高维电机控制的任务上表现更佳,有时甚至与人类奖励的相关性负相关。这表明它的策略在某些情况下比人类策略更为有效,类似于AlphaGo在下棋策略上的表现。这项研究由英伟达、宾夕法尼亚大学、加州理工学院和德州大学奥斯汀分校的研究人员合作完成,其中近半数研究人员都是华人。这一成就为机器人学习和强化学习领域带来了革命性的突破,也引发了广泛的关注和期待。
终于有人把“热泵空调”一下子给讲透了,言简意赅太清晰了
随着新能源电动车的普及,“热泵空调”一词,横空出世,估计大部分友友们都不知道具体热泵空调是干什么的,尤其是女士们,那么今天车波仕为大家通俗的讲解下热泵空调。站长网2023-05-24 01:51:400001华为 nova 12 系列今日开售 售价2999元起
华为旗下全新手机华为nova12和华为nova12Pro今日上午10点08分正式开售,起价2999元。华为nova12提供8GB256GB和8GB512GB两种存储规格,售价分别为2999元和3399元。而华为nova12Pro则提供12GB256GB和12GB512GB两种配置,售价分别为3999元和4399元。站长网2024-01-05 08:47:400000研究表明,全球十分之一大公司大规模投资人工智能
划重点:-📊仅全球十分之一的科技领袖已实施大规模人工智能项目。-💡尽管对生成式人工智能的热情高涨,但投资人工智能的公司比例在过去五年未发生变化。-💼现金紧缺和新兴技术风险是抑制大规模人工智能投资的两个主要原因。新研究显示,全球范围内,仅有很少的科技领袖已经实施了大规模人工智能(AI)项目。站长网2023-10-30 10:23:240000这下二创视频不用再担心版权了!
视频号近日新增新功能权益——影视创作授权。授权中明确表示,在允许的创作范围内,授权片单中影片可以用来做二次创作。这种公开片单可以说是为二创类视频创作者提供了一个明确的版权红线,帮助创作者在红线范围内能够更自由地使用影片。同时对于版权方来说,这种方式也能够明确告知影视的版权范围与界限。于双方而言,皆是一大利好。站长网2023-12-05 09:15:440001理想L6售价24.98万起 全系配备双电机四驱系统
昨晚,理想L6正式上市,携Pro和Max两款配置车型亮相,价格区间锁定在24.98-27.98万元。目前,消费者已可预定此车,支付的5000元定金在七天内均可无忧退还。接下来的一周,将开启小批量的交付工作,而大规模的交付则定于5月份进行。站长网2024-04-19 09:15:000000