刚刚,OpenAI发布AI Agent—Operator,全民智能体时代来了!
今天凌晨2点,OpenAI终于发布了传闻已久的AI Agent——Operator。
Operator是一个面向浏览器的智能体,能够模拟人类操作计算机的能力,完成在线订餐、预订酒店、购买机票等日常繁琐、重复任务。
例如,通过Operator在OpenTable上预订一家名为Beretta的餐厅。Operator能够自动识别指令,并在网站上完成预订操作。
与传统Agent和RPA不同的是,Operator的最大技术特点是无需依赖API或特定网站就能完成所有自动化操作,它是通过对屏幕截图的分析,识别页面元素,然后使用鼠标和键盘进行模拟。
所以,现阶段可以把Operator看成是大模型增强版的按键精灵。
Operator是基于新模型CUA(在GPT-4o基础上研发的,未来会开放API)开发而成,专门对视觉UI界面的理解和交互进行了额外专项训练,这也是Operator无需依赖API的主要原因之一。
Operator还内置了一个浏览器,能查看网页并通过打字、点击和滚动来与网页进行交互。可处理各种重复性的浏览器任务,包括填写表格、订购杂货,甚至制作表情包等。
例如,当用户上传一张包含购物清单的照片时,Operator首先会通过视觉算法识别出照片中的文字内容,然后利用大模型分析每个项目的意义,最终确定访问哪个电商平台以及搜索哪些关键词,使得Operator不仅限于简单的点击和输入操作,还能处理更加复杂的情境。
其实说到这传统的RPA、按键精灵都能做,Operator另外一大特点就是自我纠错能力,当预见错误或识别不明确时,可以根据大模型的推理能力进行实时修正。实在解决不了,会主动把控制权交给人类寻求帮助。
Operator的使用方法很简单,无需专业的编程背景或者繁琐的开发流程,就像使用ChatGPT那样用文本描述你的需求即可。
当你需要购买杂货时,可以直接上传一张购物清单的照片,或者简单地用文字描述你需要的物品,帮我购买鸡蛋、菠菜、蘑菇和鸡腿。
Operator会识别这些物品,并在你常用的购物平台上(如Instacart)完成购物任务。会自动搜索这些商品,选择合适的品牌和数量,然后将它们加入购物车。如果某些商品缺货,Operator会询问你是否需要替代品,或者是否可以跳过该商品。
此外,Operator还可以处理更复杂的任务,包括安排活动、购买演唱会门票、预订旅行计划等。例如,你可以让它帮你查找并购买本周末勇士队比赛的门票,或者安排下周的网球课程。只需简单地描述你的需求,Operator会通过互联网为你找到最佳选项,并完成预订或购买操作。
考虑到某些关键步骤可能存在风险或者不确定性,Operator支持一套完善、安全的用户交互方案。每当涉及金钱交易、个人信息填写等敏感环节时,系统都会暂停当前操作并向用户发送通知,等待进一步指示。如果遇到无法解决的问题,Operator也会主动向人类寻求帮助,不会盲目的尝试解决。
此外,Operator还内置了保护措施,会实时监控其自动化行为,当发现发现异常时会暂停任务。例如,有人可能会使用Operator进行暴力密码破解。
目前,Operator处于预览版状态,仅提供给美国Pro用户使用,很快会扩大应用范围。
超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手
o1模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士KyleKabasares,实测o1previewmini后发现:自己肝了大约1年的博士代码,o1竟在1小时内完成了。他称,在大约6次提示后,o1便创建了一个运行版本的Python代码,描述出研究论文「方法」部分的内容。站长网2024-09-18 02:33:440000GPT-4击败华尔街?最新研究:选股回报超40%
如果把选股这事交给GPT-4来处理,会是怎样一种结果?一项对美国标普100指数(S&P100)展开的研究给出了答案:GPT-4表现比基准指数高出13%,回报率高达40%,同时保持了与市场相当的风险状况。这个在GPT-4基础上打造的选股票AI,名叫MarketSenseAI。站长网2024-01-23 18:10:550000清华首个AI医院小镇来了!AI医生自进化击败人类专家,数天诊完1万名患者
【新智元导读】清华团队竟把医院搬进了AI世界!首个AI医院小镇——AgentHospital,可以完全模拟医患看病的全流程。更重要的是,AI医生可以自主进化,仅用几天的时间治疗大约1万名患者。斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。而现在,AI「医院小镇」也来了!最近,来自清华团队的研究人员开发了一个名为「AgentHospital」的模拟医院。站长网2024-05-10 10:01:430000涨粉利器!Artflow AI:一个轻松帮你做英语和动漫解说视频的软件
Artflow.ai是一款强大的人工智能工具,它的目标是帮助用户创造出自定义头像并将他们的故事栩栩如生。该工具具有以下主要特点和优势:提供了自定义创作的功能。用户可以通过输入文本来生成角色、场景和声音,并编写独特的对话。这种创作方式不仅方便快捷,而且能够满足用户个性化的需求。体验地址:https://app.artflow.ai/my-creations站长网2023-11-24 16:29:550000央视“科晚”启航,讯飞智作打造“AI 张腾岳”亮相,多语诵读成焦点
2024年,是AI应用集中爆发的一年,智能搜索、文生视频、日常聊天,这些已经融入到了我们的日常生活、工作之中,让我们享受到了便利。但对于起调颇高的AI,也不禁会有质疑,AI也不过如此。但如果说,现在的AI能够判断煤气是否泄漏,能够让爱因斯坦出现在课堂之上,亦能够让李白“亲自”朗诵诗词,这是否会让你感到诧异?其实这些看似天马行空的事情,离我们已经越来越近。0000