对标GPT4o!谷歌发布Project Astra,全民AI代理时代来啦
5月15日凌晨,谷歌召开“ I/O2024”,生成式AI成为本次大会的重点并发布了一系列产品和多款大模型。
其中,谷歌DeepMind发布了一款全新的AI 代理(Agent)产品Project Astra,可以像昨天OpenAI发布的GPT4o一样,实现跨文本、音频、视频多模态实时推理。
例如,通过手机或谷歌眼镜让Astra解答数学题,解读周围环境等,这对于盲人、翻译、学习、导游、日常办公等领域帮助非常大。
Project Astra功能展示
和GPT4o一样,Astra的多模态理解能力使其玩法非常多,这里「AIGC开放社区」就选一些有代表性的案例为大家展示。
例如,通过手机的摄像头让Astra对所有听到、看到的东西进行解读。可以点击扬声器、画笔、代码让其解释用途和含义。
此外,Astra还可以与谷歌眼镜一起配合使用,这也就是说盲人戴上它在走路、看东西时获得实时解读功能。
不过Astra的语音情感输出能力和数据响应效率,似乎比GPT4o差了一些。
也可以让Astra对一些草图、物品进行深度解读和联想。
Astra对提升搜索体验帮助也非常大,例如,通过视频让Astra解释,为什么留声机的指针没有放在转盘上,Astra会直接跳转搜索页面给出详细的解决方案。
甚至当你接到诈骗电话时,Astra都可以及时提醒你。所以,Astra更像是一位万能小管家可以做很多事情。
AI代理可以为我们做什么
其实,AI代理并非现阶段才出现的,深度游戏玩家应该知道20多年前一款外挂神器——按键精灵。
这便是最早的AI代理雏形,它可以通过用户输入的指令来执行特定操作,例如,让游戏人物只在特定场景打怪。不过使用方法比较繁琐,需要一些编程基础。
随后按键精灵演变成RPA(机器人流程自动化)从游戏场景扩展至办公领域,并在OCR、NLP、ML等多种AI加持下实现自动化完成,在金融、日常办公、数据搬运等应用非常广泛。
而Astra、Project Astra在大模型加持下的AI代理属于第三代,在使用方式、能力方面获得巨大提升,为我们做的事情也更多。
健康管理与医疗咨询:AI健康代理助手可以通过分析用户输入的症状、健康记录和生活习惯,提供个性化的健康建议和早期疾病预警。
例如,一位患有糖尿病的人可以使用AI健康助手跟踪血糖水平,获得饮食和运动建议,甚至在血糖水平异常时获得提醒和建议寻求医疗帮助。
客户服务自动化:AI代理可以集成在客服系统中,提供7*24小时无间断服务。能够理解和回应用户查询,提供账户信息、解决常见问题、处理交易等。
个性化学习辅导:AI学习代理可以根据学生的学习进度、兴趣和难点定制个性化学习计划。
通过分析学生的互动,识别其强项和弱点,然后调整教学内容和难度,以适应学生的学习速度,从而提高学习效率和成效。
目前,谷歌并没有公布Project Astra具体的发布时间,仍处于开发阶段。估计很快会登录到Android、iOS等平台中使用。
可以预见,由OpenAI、谷歌掀起的全能AI代理将成为生成式AI领域一个新的热门赛道。
同时为之前的智能RPA、AutoGPT等起到推波助澜的作用扩大认知和市场范围,极大培养了用户的习惯一个全民AI代理时代已经来临。
本文素材来源谷歌官网,如有侵权请联系删除
雷军:我当上金山CEO不是我厉害 是武大赋予我的勇气
6月20日,在武汉大学2023年毕业典礼上,小米CEO雷军代表优秀校友发言。他表示,他在28岁成为金山集团CEO并不是因为自己本身有多么厉害,而是因为每次做出决定时,他都受到了武大赋予的勇气。雷军说,在武汉大学的几年里,他学到了一项非常重要的能力,就是学习能力比知识更重要。他还鼓励武汉大学的学生们,无论何时何处,都要始终保持自信。站长网2023-06-21 14:36:1800001句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下
CMU与清华的研究者联合发布了Prompt2Model框架,它可以根据用户提供的prompt,快速训练一个小型专业模型。仅需投入5美元用于数据收集和20分钟的训练时间,就能获得性能优于ChatGPT平均水平20%的小型模型,同时模型参数规模减小了700倍。站长网2023-09-02 09:12:500000荣耀Magic6系列外观公布 将于 1 月 11 日发布
荣耀终端有限公司CEO赵明宣布,荣耀Magic6系列旗舰手机将于1月11日发布,新机预热正式启动。荣耀Magic6系列从历史文明和自然之美中汲取设计灵感,采用简洁而精致的机身设计。赵明率先公布了海湖青配色,这是荣耀Magic6系列外观的首次官方公开。0000OpenAI 增强 Assistants API 引入视觉能力支持多种图像格式
OpenAI最近宣布,其AssistantsAPI现在支持视觉能力,这标志着该公司在多模态AI领域的进一步扩展。这项更新使得API能够处理和理解图像内容,为用户提供更加丰富的交互体验。AssistantsAPI的视觉能力特点包括:支持多种图像格式:用户现在可以提交PNG、JPG、GIF和WebP格式的图像,以供API进行分析和理解。站长网2024-05-10 17:23:090000知识内容井喷,为什么我们比以前更焦虑了?
“鉴定一下网络热门生物视频。”在无穷小亮飞快的语速下,“亮记生物鉴定”系列科普视频终于迎来更新,弹幕评论里一片惊喜。这是他从图文科普博主转型到视频创作者的第四年,也正是从2019年开始,深度内容重获网民的喜爱。乘着实用主义与短视频的旋风,知识正式进入了视频时代。站长网2023-08-28 09:14:070000