自主操作计算机框架Self-Operating Computer:用GPT-4V来模拟人类的鼠标点击和键盘输入
站长网2023-11-29 11:17:111阅
自动化技术的最新进展引人瞩目,其中一项引人注目的技术是Self-Operating Computer框架。这一框架采用了先进的GPT-4V模型,通过模拟人类的鼠标点击和键盘输入,实现了令人惊叹的自主操作。在演示中,我们看到了框架自动打开浏览器并访问Google Doc,然后开始撰写诗歌。
Self-Operating Computer的核心能力在于基于给定的目标,估计鼠标点击的正确X和Y坐标位置,以及在每个步骤中进行适当的键盘输入。这一创新的框架旨在与任何视觉-文本多模态模型协同工作,以评估其操作计算机的能力。其使用GPT-4V的强大模拟功能使得计算机可以自主执行各种任务,展现了令人惊叹的智能水平。
项目地址:
https://github.com/OthersideAI/self-operating-computer#self-operating-computer-framework
值得注意的是,目前Self-Operating Computer框架仅支持在Mac系统中使用。不过,对于有兴趣的用户,他们可以通过自行部署来体验这一引人入胜的技术。这种自主操作计算机的框架为用户提供了一个全新的可能性,使得计算机不再仅仅是被动执行任务的工具,而是能够根据预定目标主动进行操作。
总体而言,Self-Operating Computer框架的出现标志着自动化领域的一次重大飞跃。通过结合先进的模型和多模态技术,该框架展示了计算机自主执行任务的新水平。
尽管目前仅限于Mac系统,但随着技术的不断发展,相信将来会有更广泛的应用场景涌现。自主操作的计算机框架无疑将改变我们对计算机能力的认知,为未来的科技发展打开崭新的可能性。
0001
评论列表
共(0)条相关推荐
元气森林不能输的一战
对产品很熟悉的元气森林创始人唐彬森,在5杯外观一模一样的气泡水中,并没有准备识别出有没有自家产品,以及哪家是自家产品。这样的场景发生在2021年央视《对话》节目上,那年是元气森林高速增长的最后一年,仅无糖气泡水就卖出了1亿箱。投资人们为了拿到一点儿份额,一度让元气森林北京亮马桥办公室的前台“人满为患”。所有人都对未来充满信心。站长网2023-05-15 08:49:330000英国提出新的在线安全法案:用AI判定用户是否达到合法观看色情内容年龄
#划重点1.英国政府提出新的在线安全法案,其中包括使用基于人工智能的技术来判断用户是否达到合法观看色情内容的年龄。2.拟议中的方法包括面部年龄估计、照片身份匹配、信用查验以及开放银行等多种手段。3.观察机构和自由市场智库对强制年龄验证提出担忧,认为可能威胁用户隐私并增加敏感数据泄露的风险。站长网2023-12-05 09:41:400000日本发布指导方针 允许在学校有限使用ChatGPT等生成式AI
近日,日本教育部已发布指导方针,允许在小学、初中和高中有限使用ChatGPT等生成式人工智能。在认识到学生牢固掌握人工智能及其用途的重要性的同时,该指南还考虑到该技术可能会对学生的批判性思维和其他技能产生负面影响。该指南呼吁小学生谨慎使用,因为ChatGPT使用条款建议仅由13岁及以上的人使用。日本执政党和政府中的一些人对允许年轻人接触人工智能持谨慎态度。站长网2023-07-05 17:28:250001马斯克:特斯拉自动驾驶出租车选中国吉祥日子发布
近日,有网友好奇地向特斯拉创始人埃隆·马斯克提问,关于为何选择8月8日作为特斯拉最新自动驾驶出租车Robotaxi的发布日期。马斯克在回应中透露,这一选择并非随意,而是基于对中国文化的深刻理解和个人情感的寄托。站长网2024-05-01 15:06:510000OpenAI将在伦敦开设办事处 吸纳顶尖人才
OpenAI将在伦敦开设其首家国际办事处,这标志着其发展战略的又一重要一步。这家人工智能公司将伦敦的文化多样性和令人印象深刻的人才储备作为选择的关键原因,OpenAI认为这些特点非常适合扩大其研发能力。具体而言,OpenAI计划在伦敦建立跨研究、工程和市场部门的团队。站长网2023-06-29 15:59:430000