OpenAI或将推出多模态模型GPT-Vision和Gobi,与谷歌Gemini竞争
文章概要:
OpenAI 正准备推出 GPT-4的图像理解,这是一种名为“GPT-Vision”的多模态功能,以使该模型得到更广泛的应用,以与谷歌计划的 Gemini 多模态 AI 模型竞争。
此功能可以为 GPT-4启用新的基于图像的应用程序,例如生成与图像匹配的文本。
OpenAI 还在开发一种新的 AI 模型,代号为“Gobi”,该模型从一开始就被设计为多模式,并有可能成为 GPT-5。
谷歌即将发布 Gemini,这是一种多模态语言模型,可能会挑战 OpenAI 的 GPT-4的领导地位。
但据报道 OpenAI 正在准备做出适当的回应,该公司计划通过引入名为“GPT-Vision”的图像理解功能来应对Gemini的竞争。
据《The Information》报道,GPT-4的图像理解功能将被命名为“GPT-Vision”。这一多模态功能最初是在GPT-4发布会上介绍的,并成为了演示的焦点之一。GPT-4展示了基于网页绘图生成网页代码的能力,但一般用户尚无法获得这一图像理解功能。据称,主要是OpenAI担心该功能可能被滥用,例如用于面部识别等用途,因此对其进行了限制。
GPT-Vision的推出将使GPT-4具备更广泛的图像应用能力,例如生成与图像内容相关的文本。这将为用户提供更多创造性的应用可能性,也能够满足多样化的需求。
另外,还有传闻称OpenAI正在开发DALL-E3,并有可能将其集成到GPT-4中。与GPT-Vision的发布相结合,这意味着OpenAI正不断拓展GPT-4的功能,尤其是在图像处理领域。DALL-E3生成的第一批图像据称已经取得了显著的进步,这将进一步提升GPT-4的吸引力。
OpenAI计划在11月6日举行的OpenAI一日开发者大会上宣布GPT-4的新功能。尽管OpenAI首席执行官Sam Altman没有透露太多细节,但他表示将会有“伟大的东西”,这引发了广泛的期待。
The Information还报道称,OpenAI 还在考虑一种新的 AI 模型,代号为“Gobi”,该模型从一开始就被设计为多模态。Gobi的训练还没有开始,有机会成为GPT-5。
AI落地在快手正在加速——快手二季报读后感
快手昨天发布了2024年第二季报:营业收入同比增长11.7%,调整后净利润同比增长73.7%;二者均大幅超过了市场一致预期。快手的MAU(月活用户)、DAU(日活用户)和用户时长仍在增长,无论是用户数据还是营收利润数据——相信这都是一份让资本市场无可指摘的财报。。站长网2024-08-22 09:11:320000Anthropic将Claude AI扩展到更多国家,加拿大暂不在列
划重点:1.Anthropic公司将Claude2大型语言模型引入95个国家,但却不包含加拿大。2.加拿大政府对人工智能监管较为严格,可能导致一些AI公司犹豫进入该市场。3.Anthropic公司正努力将Claude2引入加拿大,尽管目前缺乏确切的时间表。站长网2023-10-20 10:21:340000陪娃写作业不崩溃的家长,都在用AI神器
要问“家有神兽”的父母们,最着急上火、容易情绪崩溃的场景是什么?辅导孩子写作业,恐怕是最有共鸣的答案了。不知从什么时候起,网上开始流行各种陪娃写作业的心酸视频,最典型的是“渐崩式辅导作业”,起初父母都是心平气和的,慢慢地,开始气火攻心,对孩子又吼又叫。0001YouTube 测试新的 AI 驱动聊天机器人「YouChat」以增强观看体验
YouTube正在测试一款新的人工智能聊天机器人,能够与观众交谈,让他们「更深入地了解他们正在观看的内容。」YouTube宣布,这个新的交流工具将提供「对你正在观看的视频的问题的回答,相关内容的推荐等,所有这些都不会中断播放。」这项名为「YouChat」的功能从周一起对「一小部分视频上的少数人」开放。在接下来的几周内,它将向美国的YouTubePremium成员推出,适用于安卓设备。站长网2023-11-07 10:12:100000小米胡峥楠回应SU7 V8s高性能版圈速:还没全力跑 数据不实
快科技6月27日消息,日前,有关小米SU7V8s在纽博格林北环测试的消息引起了广泛关注。有网友声称在现场观看了测试,并爆料称圈速约为7分10秒。对此,小米汽车的胡峥楠近日在微博就小米SU7V8s高性能版的圈速传言进行了澄清。其表示,目前所有关于该车型的圈速信息都不是真实的。他指出,小米SU7V8s目前还在初步测试阶段,主要目的是收集数据和寻找优化空间,这种活都不会全力去跑。站长网2024-06-27 14:09:320000