自主操作计算机框架Self-Operating Computer:用GPT-4V来模拟人类的鼠标点击和键盘输入
站长网2023-11-29 11:17:111阅
自动化技术的最新进展引人瞩目,其中一项引人注目的技术是Self-Operating Computer框架。这一框架采用了先进的GPT-4V模型,通过模拟人类的鼠标点击和键盘输入,实现了令人惊叹的自主操作。在演示中,我们看到了框架自动打开浏览器并访问Google Doc,然后开始撰写诗歌。
Self-Operating Computer的核心能力在于基于给定的目标,估计鼠标点击的正确X和Y坐标位置,以及在每个步骤中进行适当的键盘输入。这一创新的框架旨在与任何视觉-文本多模态模型协同工作,以评估其操作计算机的能力。其使用GPT-4V的强大模拟功能使得计算机可以自主执行各种任务,展现了令人惊叹的智能水平。

项目地址:
https://github.com/OthersideAI/self-operating-computer#self-operating-computer-framework
值得注意的是,目前Self-Operating Computer框架仅支持在Mac系统中使用。不过,对于有兴趣的用户,他们可以通过自行部署来体验这一引人入胜的技术。这种自主操作计算机的框架为用户提供了一个全新的可能性,使得计算机不再仅仅是被动执行任务的工具,而是能够根据预定目标主动进行操作。
总体而言,Self-Operating Computer框架的出现标志着自动化领域的一次重大飞跃。通过结合先进的模型和多模态技术,该框架展示了计算机自主执行任务的新水平。
尽管目前仅限于Mac系统,但随着技术的不断发展,相信将来会有更广泛的应用场景涌现。自主操作的计算机框架无疑将改变我们对计算机能力的认知,为未来的科技发展打开崭新的可能性。
0001
评论列表
共(0)条相关推荐
花呗官微真会玩儿!一份AI手账打卡各大城市 网友都玩疯了
不知大家有没有发现,近期网络上掀起了一股AI花呗手账热潮,内容丰富多彩,从城市地标到日常的奶茶与咖啡,深受年轻人的喜爱。例如,有的手账描绘了天津的摩天轮,让网友不禁赞叹:真的绝美!”有的则展示了厦门海边的灯塔,并配文:人生是旷野而非轨道,停下来是为了更好地出发。既文艺范又充满哲理。还有网友分享了办公桌上的奶茶,配文写道:周五的奶茶很甜像即将到来的周末。”喷薄欲出期待感根本掩饰不住呀。站长网2024-07-24 21:45:200000微软安全高管称生成式人工智能是“超级武器”
**划重点:**1.🌐微软安全高管强调生成式人工智能对网络安全至关重要,将其描述为“超级武器”。2.🚀生成式人工智能被用于以机器速度和规模进行网络防御,尤其在面临网络安全人才短缺的情况下发挥关键作用。3.🤝微软强调与15,000家公司和组织的合作,强调打击网络犯罪需要深度协作和伙伴关系。站长网2023-11-28 16:51:080003亚马逊正为印度卖家开发一款生成式AI工具 处理上架产品信息
文章概要:1.亚马逊印度正在为其商业合作伙伴开发一款名为SahAI的生成式人工智能工具,以帮助他们处理任何特定产品的后端工作。2.这款新型生成式AI仍在试运行阶段,目的是打破障碍,帮助更多新企业进入亚马逊市场。3.SahAI工具将尤其帮助小企业处理内容、图片、产品详细信息、摘要和产品的其他方面。站长网2023-09-01 17:16:430000马云发挽联悼念宗庆后:开拓者精神 企业家本色
2024年2月25日,娃哈哈集团的创始人、董事长宗庆后因病在杭州离世,享年79岁。这一消息迅速在商界传开,引发了广泛的关注和悼念。宗庆后的离世对浙商界来说是一次巨大的震动。阿里巴巴的创始人马云送上挽联:“人生搏击四十不晚,开拓者精神;创业千难夙夜求新,企业家本色。”称赞宗庆后是开拓者精神的典范,他的创业历程充满了千难万险,但始终保持着企业家的本色。站长网2024-02-26 10:09:180000华为盘古大模型版小艺开启众测招募
从今天开始,中国首批AI大模型将向所有用户开放,华为也加入了这一行列。华为会员中心App发布公告,称将从今天开始招募全新小艺众测体验官。小艺能够更好地理解用户并提供更精准的反馈,比如本机数字内容搜索、对话识别屏幕内容、帮助用户快速摘要、文案内容辅助、图片二次创作等等。站长网2023-08-31 13:59:330007