AI已经会“玩”手机了!腾讯开发AppAgent 可模仿人类在手机上操作APP
站长网2023-12-22 16:57:384阅
腾讯和德州大学达拉斯分校的研究团队合作开发了一个名为AppAgent的项目,该项目可以通过自主学习和模仿人类的点击和滑动手势,在手机上执行各种任务。
这包括在社交媒体上发帖、帮助用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑。AppAgent在50个任务上进行了广泛测试,涵盖了10种不同的应用程序。

项目地址:https://github.com/mnotgod96/AppAgent
AppAgent的主要功能特点包括多模态代理、直观交互、自主学习和构建知识库。作为一个基于大语言模型的多模态代理,AppAgent能够处理和理解多种类型的信息,使得它能够理解复杂的任务并在各种不同的应用程序中执行这些任务。
它能够通过模仿人类的直观动作来与智能手机应用程序交互,就像一个真人用户一样。通过观察和分析不同应用程序中的用户界面交互,AppAgent能够自主学习并构建知识库,记录了不同应用程序的操作方法和界面布局,以便指导代理在不同应用程序中执行任务。
一旦学习了应用程序的操作方式,AppAgent就能够执行跨应用程序的复杂任务,如发送电子邮件、编辑图片或进行在线购物。这一创新的技术为用户提供了更便捷和高效的手机应用程序操作体验。
0004
评论列表
共(0)条相关推荐
云从科技将于5月18日发布大模型产品 涵盖金融、游戏等多个领域
据36氪报道,人脸识别供应商云从科技将于5月18日发布大模型产品。据知情人士称,云从科技正在全力投入行业大模型研发,将其引入人机协同操作系统中。消息称,云从科技的大模型产品将主要应用于智慧金融、智慧交通以及公司此前披露定增预案中所述领域。该公司的大模型产品将面向政府、企业以及消费者三个方向,覆盖金融、游戏、质量、交通等多个领域。站长网2023-05-09 12:02:320003“少数人”的胜利,Midjourney走上AIGC神坛
如今,不知道Midjourney这家公司,似乎就不配谈AIGC。不久前,AI绘图工具Midjourney发布了第五代V5模型,由它生成的一张“中国情侣”图片因效果酷似真人而火爆出圈。紧接着,又进一步宣布推出针对二次元、动漫风格的版本。站长网2023-04-27 09:14:410001Bard推出图片生成功能 由Imagen 2图像生成模型提供支持
Bard已经更新,现在具有生成图片的能力。这一功能由DeepMind的Imagen2图像生成模型提供支持。Imagen2基于GoogleDeepMind的扩散式模型,通过对更高质量的图像描述进行训练,生成更加详细、语义更为准确的图像。相比之前的系统,Imagen2在处理细节方面更加准确,更善于捕捉细微差别,为各种风格和用例提供更逼真的图像。站长网2024-02-02 10:26:410000超过一半的艺术家担忧观众如何看待使用 AI 辅助创作的音乐
站长之家(ChinaZ.com)11月3日消息:随着人工智能(AI)的不断普及,全球各行各业对其变革能力的接受度日增,而音乐产业也不例外。然而,该行业对AI技术的接纳同时伴随着对于创作者权益的担忧。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-11-03 09:04:310000特斯拉五年免息上热搜:7月31日前下单即可享受
特斯拉今日正式揭晓了Model3和ModelY两款车型在七月的购车权益。对于标准续航和长续航四轮驱动版车型,消费者在7月31日前下单,即可享受限时五年零利率的分期购车方案。相较于上月的购车政策,此次优惠方案将长续航全轮驱动版车型也纳入了五年免息的范畴。站长网2024-07-01 19:50:350000