谷歌推出其「规模最大、能力最强」的人工智能模型 Gemini,迎合 AI 商业化的压力
谷歌在当地时间周三宣布推出其认为是迄今为止规模最大、能力最强的人工智能模型 Gemini,以回应公司如何盈利化 AI 的迫切问题。
这个大型语言模型 Gemini 包括三种不同规模的套件:最大、最强大的 Gemini Ultra;适用于广泛任务的 Gemini Pro;以及专用于特定任务和移动设备的 Gemini Nano。
目前,该公司计划通过谷歌云将 Gemini 授权给客户,供他们在自己的应用程序中使用。从 12 月 13 日起,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。安卓开发者也将能够使用 Gemini Nano 进行构建。Gemini 还将用于驱动谷歌产品,如其 Bard 聊天机器人和尝试以对话式文本回答搜索查询的搜索生成体验(SGE),后者尚未广泛推出。
公司和企业可以使用 Gemini 进行更先进的客户服务互动,如聊天机器人和产品推荐,以及识别公司想要宣传产品的趋势。Gemini 还可以用于内容创作,如果公司想要创建营销活动或博客内容,以及希望总结会议或为开发者生成代码的生产力应用程序。
该公司给出的例子包括让 Gemini 获取图表的截图,并分析数百页研究,然后更新该图表。另一个例子是分析一个人的数学家庭作业照片,并识别正确答案和指出错误答案。
Gemini Ultra 是首个在 MMLU(大规模多任务语言理解)上胜过人类专家的模型,MMLU 使用 57 个科目的组合,如数学、物理、历史、法律、医学和伦理,测试世界知识和解决问题的能力。据该公司在周三的博客文章中表示,它能够理解复杂主题中的细微差别和推理。
「Gemini 是谷歌团队间大规模合作努力的结果,包括我们在谷歌研究的同事,」皮查伊在周三的博客文章中写道。「它从头开始构建,是多模态的,这意味着它可以泛化,并无缝理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。」
从今天开始,谷歌的聊天机器人 Bard 将使用 Gemini Pro 来帮助进行高级推理、计划、理解和其他能力。明年初,它将推出使用 Gemini Ultra 的「Bard Advanced」,这将是 Bard 更新的最大一次,它类似于 OpenAI 的 ChatGPT 聊天机器人。
这次更新是在谷歌首次推出 Bard 和 OpenAI 在 GPT-3.5 上推出 ChatGPT 一年后进行的。今年 3 月,由 Sam Altman 领导的初创公司推出了 GPT-4。高管们周二表示,Gemini Pro 在性能上超过了 GPT-3.5,但对于与 GPT-4 的比较避而不谈。
然而,据谷歌周三发布的一份白皮书显示,Gemini 的 Ultra 模型在一些基准测试中超过了 GPT-4。
当被问及谷歌是否计划对「Bard Advanced」的访问收费时,谷歌 Bard 的总经理 Sissie Hsiao 表示,公司专注于创造良好的体验,目前还没有任何盈利细节。
在新闻发布会上,当被问及 Gemini 与当前一代 LLM 相比是否有任何新颖功能时,谷歌 DeepMind 的产品副总裁 Eli Collins 回答说:「我怀疑它确实有」,但他们仍在努力了解 Gemini Ultra 的新颖功能。
据报道,谷歌推迟了 Gemini 的发布,因为它还没准备好,这让人回想起该公司年初推出其 AI 工具时的混乱局面。
多名记者询问了关于延迟的问题,对此 Collins 回答说,测试更先进的模型需要更长的时间。Collins 表示,Gemini 是该公司构建的经过最严格测试的 AI 模型,并且是谷歌任何模型中「最全面的安全评估」。
Collins 说,尽管 Gemini Ultra 是其最大的模型,但提供服务的成本显著降低。他说:「它不仅能力更强,而且更高效。我们仍然需要大量计算来训练 Gemini,但我们在训练这些模型方面变得更加高效。」
Collins 表示,该公司将在周三发布一份关于该模型的技术白皮书,但他表示不会公布参数数量。今年早些时候,CNBC 发现谷歌的 PaLM 2 大型语言模型,当时的最新 AI 模型,其训练用的文本数据量是前一代 LLM 的近五倍。
同样在周三,谷歌还推出了其下一代用于训练 AI 模型的张量处理单元。Salesforce 和初创公司 Lightricks 已开始使用的 TPU v5p 芯片,其性能价格比优于 2021 年宣布的 TPU v4,但谷歌没有提供与市场领导者 Nvidia 相比的性能信息。
这一芯片发布是在云计算竞争对手亚马逊和微软展示针对 AI 的定制芯片几周后进行的。
在 10 月的谷歌第三季度财报电话会议上,投资者向高管们提出了更多关于谷歌如何将 AI 转化为实际利润的问题。
今年 8 月,谷歌推出了一个名为「搜索生成体验」(SGE)的「早期实验」,该实验让用户看到在使用搜索引擎时生成式 AI 体验是什么样的——搜索仍然是该公司的主要盈利中心。其结果更具对话性,反映了聊天机器人时代的特点。然而,它仍被视为实验,并尚未向公众推出。
自从 5 月公司在其年度开发者大会 Google I/O 上首次宣布该实验以来,投资者一直在询问 SGE 的时间表。Gemini 周三的公告几乎没有提及 SGE,高管们对其向公众推出的计划含糊其辞,称 Gemini 将「在明年」并入其中。
皮查伊在周三的博客文章中表示:「这个模型驱动的新时代代表了我们作为一家公司所做出的最大的科学和工程努力之一。」「我对未来以及 Gemini 将为世界各地的人们带来的机会感到由衷的兴奋。」
2023 年人工智能改变互联网的 5 种方式
尽管难以置信,但ChatGPT才推出仅有一年的历史。自从OpenAI在2022年11月首次发布ChatGPT以来,它迅速成为有史以来增长最快的应用程序,引发了谷歌的恐慌,并点燃了大型科技公司内部的生成型AI竞赛。自那以后,生成型AI的兴起被誉为下一个工业革命,引发了关于人类生存的哲学和伦理问题,并使政府关注其破坏性潜力。因此,对于AI来说,这确实是重大的一年。0000Ouroboros3D:通过3D感知实现图像到3D的生成
划重点:🔍Ouroboros3D是一个集成了多视角图像生成和3D重建的统一3D生成框架🔍通过递归扩散过程,Ouroboros3D实现了从图像到3D的生成🔍Ouroboros3D采用了基于扩散的多视角图像生成和3D重建方法站长网2024-06-06 17:20:590000OpenAI 等人工智能公司想从媒体集团那里得到什么?
上周,AxelSpringer(拥有Politico和BusinessInsider的德国媒体集团)签署了一项价值数千万欧元的「多年许可协议」。图片来自AxelSpringer据该公司表示,该协议将「通过添加最新和权威内容的摘要,丰富用户与ChatGPT的互动体验。」AxelSpringer的报道文章也将用于训练OpenAI的模型。站长网2023-12-18 12:07:210000谷歌内测员工称 Bard 为“病态的骗子”,为追赶 ChatGPT 不顾道德伦理?
站长网2023-04-23 12:14:290000谷歌摸鱼神器来了:推出AI会议替身,一键总结提问发言
饱受会议折磨的打工人,终于可以解放了!就在刚刚举办的GoogleCloudNext’23大会上,谷歌宣布了一系列科技新进展,最瞩目的要属其中的“开会AI替身”了。只需要一句“帮我参加”,AI就能替你开会,并在合适的时机发言提问:这样一来,即使开会时摸鱼,也不怕老板突然点名了(手动狗头)有网友狂喜,要是真有这个AI数字替身帮我天天开会,我生产力直接拉满!站长网2023-08-31 09:05:470000