麻省理工学院推GenSim项目:利用大语言模型编写机器人新任务
**划重点:**
1. 🌐 MIT CSAIL的“GenSim”项目利用大型语言模型(LLMs)如GPT-4,通过自动生成新任务或详细说明所需行为的每个步骤,扩大了机器人可以接受培训的仿真任务范围。
2. 🤖 GenSim系统具有目标导向和探索两种模式,通过LLM生成任务描述和模拟行为所需的代码,然后利用任务库优化代码,最终生成能教导机器人执行新任务的仿真。
3. 💡 在经过人类预训练的基础上,GenSim自动产生了100种新行为,相比之下,类似的基准测试需要手动编写每个任务。该系统在演示中成功地训练机械臂执行任务,如以比可比方法更高的速度放置彩色积木。
你可能听说过“经验是最好的老师”,但如果在现实世界中学习成本太高怎么办?这是训练机器人进行操纵任务的机器人学家所面临的困境。由于真实世界的互动数据昂贵,他们的机器人通常通过不同活动的模拟版本进行学习。
图源备注:图片由AI生成,图片授权服务商Midjourney
然而,这些模拟只能提供有限范围的任务,因为每个行为都是由人类专家单独编码的。因此,许多机器人无法完成它们之前未见过的任务提示。例如,机器人可能无法组装玩具汽车,因为它需要理解该请求中的每个较小任务。如果没有足够的创造性模拟数据,机器人无法完成这个总体过程中的每一步(有时称为长时程任务)。
麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的“GenSim”试图通过用户提示大型语言模型(LLMs)自动生成新任务或概述所需行为的每一步来扩大这些机器人可以接受培训的模拟任务。该方法通过利用像GPT-4这样的模型内部的代码,帮助机器人完成制造、家务和物流等任务中的每个步骤。
该系统具有目标导向和探索两种模式。在目标导向设置中,GenSim接受用户输入的任务,并分解完成该目标所需的每一步。在探索设置中,系统提出新任务。在这两种模式下,该过程始于LLM生成任务描述和模拟行为所需的代码。然后,模型使用任务库优化代码。这些说明的最终版本可以创建教导机器人如何执行新任务的仿真。
在人类对系统进行了十个任务的预训练后,GenSim自动产生了100种新行为。与此同时,可比较的基准测试只能通过手动编写每个任务来达到相同的效果。GenSim还在几次演示中协助机械臂成功执行任务,例如以比可比方法更高的速度放置彩色积木。
麻省理工学院计算机科学与人工智能实验室的博士生Lirui Wang表示:“起初,我们认为将大型语言模型中找到的概括和外推能力引入机器人将是令人惊异的。因此,我们着手通过仿真程序的媒介来提炼那些知识。然后,我们在仿真任务上训练的模型基于生成的任务进行了实际政策引导,通过适应性进行演示,表明GenSim在仿真和实际世界中均可行。”
GenSim可能有助于厨房机器人、制造业和物流领域,在这些领域,该方法可以生成用于培训的行为。这将使机器人能够适应具有多步骤过程的环境,例如堆叠和将箱子移动到正确的区域。
目前,该系统只能辅助拾取和放置活动,但研究人员相信GenSim最终可以生成更复杂、更灵活的任务,例如使用锤子、打开盒子并将物品放在架子上。此外,该方法容易出现幻觉和基础问题,需要进一步进行真实世界测试以评估其生成任务的实用性。尽管如此,GenSim为LLMs在构思新型机器人活动方面展示了令人鼓舞的未来。
项目网址:https://github.com/liruiw/GenSim
国产短剧已经疯了:“霸总爱上绝经的我”,女主不是保姆就是保洁
今天突然几个短剧话题上了热搜,抱着好奇心翻了下,一看就差点惊掉了下巴。在“国产短剧疯了”这个话题下,置顶的是一位博主对某一短剧剧情的吐槽。剧情很长,截图大家看下,简单来说就是45岁中年保洁阿姨与小年轻霸道总裁一夜生情,然后又各种神反转的剧情:保洁阿姨和男主爸爸是同学,爸爸还追过保洁阿姨,然后保洁阿姨被各种刁难……最后保洁阿姨是世界首富,是藏得最深的女BOSS。0000Vary-toy:具有高级视觉词汇视觉语音模型 适用于标准GPU
划重点:📌挑战与潜力:大型视觉语言模型(LVLMs)在计算机视觉(CV)和自然语言处理(NLP)交叉任务中表现出色,但在图像感知能力方面仍有潜力待发。📌模型结构:目前的LVLMs通常采用图像标记作为前缀或交叉注意力进行特征融合。然而,模型的效率可能受到视觉词汇网络在编码视觉信号方面的限制。站长网2024-01-31 11:41:340000国产手机抢占iPhone市场 4月出货量破2000万部 占比创今年新高
快科技5月28日消息,中国信息通信研究院今天发布了2024年4月国内手机市场的运行分析报告。报告指出,2024年4月,国内品牌手机的出货量达到2057.6万部,同比增长了25.5%,占同期手机总出货量的85.5%。在今年的前三个月中,国产品牌手机的出货量占比分别为83%、83%和82%,而4月的85.5%是本年度的最高值。站长网2024-05-28 19:35:410000小红书博主用AI画出无价的饭获赞21.9万 网友感动哭
近期,一种新的ChatGPT文生图玩法在海外社交媒体平台上引起了轰动,即在提示词中输入“Makeitmore”,从而引发AI创作出丰富的想象力。这一新形式的内容创作近期持续走红,产生了许多爆款,比如一名男孩因收到圣诞礼物是煤炭而气得用空袭炸了圣诞老人的家,相关视频在YouTube上播放量高达203万次,并获得了13万个赞。同样,另一则小朋友吵架吵到宇宙爆炸的故事在小红书上获得了13.7万个赞。站长网2023-12-27 15:09:460000“偏科”的国产大模型:长于文本、弱于数理、作画凑合
国产大模型集体交答卷了。8月31日,首批11家国产大模型获批上线,包括百度的“文心一言”、商汤科技的“商量SenseChat”、智谱AI的“智谱清言”、MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、抖音的“云雀”、百川智能的“百川”以及中科院旗下的“紫东太初”、科大讯飞的“讯飞星火认知大模型”、阿里“通义千问”、360智脑。站长网2023-09-04 15:40:360000