刚刚,OpenAI发布AI Agent—Operator,全民智能体时代来了!
今天凌晨2点,OpenAI终于发布了传闻已久的AI Agent——Operator。
Operator是一个面向浏览器的智能体,能够模拟人类操作计算机的能力,完成在线订餐、预订酒店、购买机票等日常繁琐、重复任务。
例如,通过Operator在OpenTable上预订一家名为Beretta的餐厅。Operator能够自动识别指令,并在网站上完成预订操作。
与传统Agent和RPA不同的是,Operator的最大技术特点是无需依赖API或特定网站就能完成所有自动化操作,它是通过对屏幕截图的分析,识别页面元素,然后使用鼠标和键盘进行模拟。
所以,现阶段可以把Operator看成是大模型增强版的按键精灵。
Operator是基于新模型CUA(在GPT-4o基础上研发的,未来会开放API)开发而成,专门对视觉UI界面的理解和交互进行了额外专项训练,这也是Operator无需依赖API的主要原因之一。
Operator还内置了一个浏览器,能查看网页并通过打字、点击和滚动来与网页进行交互。可处理各种重复性的浏览器任务,包括填写表格、订购杂货,甚至制作表情包等。
例如,当用户上传一张包含购物清单的照片时,Operator首先会通过视觉算法识别出照片中的文字内容,然后利用大模型分析每个项目的意义,最终确定访问哪个电商平台以及搜索哪些关键词,使得Operator不仅限于简单的点击和输入操作,还能处理更加复杂的情境。
其实说到这传统的RPA、按键精灵都能做,Operator另外一大特点就是自我纠错能力,当预见错误或识别不明确时,可以根据大模型的推理能力进行实时修正。实在解决不了,会主动把控制权交给人类寻求帮助。
Operator的使用方法很简单,无需专业的编程背景或者繁琐的开发流程,就像使用ChatGPT那样用文本描述你的需求即可。
当你需要购买杂货时,可以直接上传一张购物清单的照片,或者简单地用文字描述你需要的物品,帮我购买鸡蛋、菠菜、蘑菇和鸡腿。
Operator会识别这些物品,并在你常用的购物平台上(如Instacart)完成购物任务。会自动搜索这些商品,选择合适的品牌和数量,然后将它们加入购物车。如果某些商品缺货,Operator会询问你是否需要替代品,或者是否可以跳过该商品。
此外,Operator还可以处理更复杂的任务,包括安排活动、购买演唱会门票、预订旅行计划等。例如,你可以让它帮你查找并购买本周末勇士队比赛的门票,或者安排下周的网球课程。只需简单地描述你的需求,Operator会通过互联网为你找到最佳选项,并完成预订或购买操作。
考虑到某些关键步骤可能存在风险或者不确定性,Operator支持一套完善、安全的用户交互方案。每当涉及金钱交易、个人信息填写等敏感环节时,系统都会暂停当前操作并向用户发送通知,等待进一步指示。如果遇到无法解决的问题,Operator也会主动向人类寻求帮助,不会盲目的尝试解决。
此外,Operator还内置了保护措施,会实时监控其自动化行为,当发现发现异常时会暂停任务。例如,有人可能会使用Operator进行暴力密码破解。
目前,Operator处于预览版状态,仅提供给美国Pro用户使用,很快会扩大应用范围。
微软开源GraphRAG:极大增强大模型问答、摘要、推理
7月3日,微软在官网开源了基于图的RAG(检索增强生成)——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力,RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。传统的RAG系统在处理外部数据源时,只是简单地将文档转换为文本,将其分割为片段,然后嵌入到向量空间中,使得相似的语义对应相近的位置。站长网2024-07-03 09:00:050001夸克App推出“AI学习助手” 基于自研大模型打造
站长之家(ChinaZ.com)1月9日消息:近日,夸克App宣布推出全新的AI学习助手,为用户提供更加智能的学习体验。这款AI学习助手基于夸克自研的大模型技术,采用夸克宝宝的虚拟形象为用户进行题目讲解。0000在变化中寻找解法 数据安全为数字经济发展保驾护航
来源:人民网原创稿数据是数字经济的核心生产要素,而保护数据安全,是数字经济发展的重点之一。数据的主体是谁?如何从国家、企业层面保护数据安全?如何促进数据有序跨境流动?围绕数据安全这一话题,多位专家学者在博鳌亚洲论坛上展开讨论。0000OpenAI 人工智能文本检测器正确率只有 26% 且有 9% 的误报
OpenAI日前关闭了一个本应用于区分人类写作和AI写作的工具,原因是准确率较低。在一篇(更新后的)博客中,OpenAI表示决定自2023年7月20日起停用其AI检测器。该公司表示:「我们正在努力吸纳反馈意见,并正在研究更有效的文本来源技术。」站长网2023-07-26 15:42:200001茶饮门店用KOC玩法一年赚1000多万!
他曾拥有30家直营茶饮店,年营收达到1500万,私域用户积累达25万。然而在疫情过后,由于同行低价竞争的加剧,他们过去的私域策略通通失效,新客户难以吸引,私域优惠券销售停滞,原本依赖私域流量的商业模式受到了重创。面对成本压力和用户行为的变化,拔尖文化CEO陈文不得不进行策略调整。他意识到,要想在价格战中生存,必须拥有供应链优势,而这对于小规模企业来说几乎不可能。站长网2024-05-22 19:53:460001