Gemini 是谷歌迄今为止最佳的 AI 模型 但充满希望的基准测试和演示最终引发了批评
谷歌近日公布了其最新的人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了谷歌的自信。
然而,随着 AI 工程师和爱好者深入探究细节后发现了一些缺陷,这股积极氛围逐渐转变。虽然「Gemini」在技术上令人印象深刻,有望最终挑战 GPT-4 的主导地位,但谷歌模糊不清的信息传达方式使其不得不处于防守状态。
北美某大型零售商的首席 AI 工程师 Emma Matthies 表示:「目前问题多于答案。我发现谷歌宣传视频中的展示与其技术博客中的细节之间存在不一致。」
谷歌陷入困境的演示
Gemini 的演示视频在 YouTube 上发布,题为「亲身体验 Gemini」,视频风格快节奏、友好、有趣,充满易于理解的视觉示例。然而,它对「Gemini」的工作原理有所夸大。谷歌代表声称该演示视频展示了「Gemini」的真实提示和输出,但编辑过程省略了一些细节。例如,与「Gemini」的互动是通过文本进行的,而不是语音,AI 解决的视觉问题是通过图片输入的,而不是实时视频。
此外,AI 开发者迅速意识到「Gemini」的能力并不如最初看起来那样革命性。
性能比较
谷歌在其基准测试数据上也受到批评。家族中最大的模型「Gemini Ultra」宣称在多种基准测试中超越 GPT-4,这在大体上是正确的,但引用的数据是为了将「Gemini」描绘得更加优秀。
谷歌使用与其他公司不同的方法来测量性能,用户提示 AI 模型的方式会影响其性能,只有在使用相同的提示策略时,结果才具有可比性。
尽管如此,「Gemini」的多模态功能仍然令人印象深刻。它能够跨文本、图像、音频、代码和其他媒介进行推理。虽然这并非「Gemini」所独有,但大多数多模态模型要么未公开,要么使用困难,或专注于特定任务。这使 OpenAI 的 GPT-4 在这一领域中占据主导地位。
未来展望
「Gemini」的命运尚未确定,取决于两个未知因素:「Gemini Ultra」的发布日期以及 OpenAI 的 GPT-5。
尽管用户现在可以尝试「Gemini Pro」,但其更强大的兄弟版本将于 2024 年某时发布。AI 领域的快速发展使得人们很难预测 Ultra 发布时的情况,同时也给了 OpenAI 足够的时间来用新模型或对 GPT-4 的适度改进作出回应。
视觉语言模型BLIVA:让AI更擅长阅读图像中的文本 懂得看路牌和食品包装
文章概要:1.BLIVA是一种视觉语言模型,擅长读取图像中的文本。2.BLIVA结合了InstructBLIP的学习查询嵌入和LLaVA的编码修补嵌入。3.BLIVA在多个数据集上表现优异,可用于识别路牌、食品包装等场景。BLIVA是一种视觉语言模型,擅长读取图像中的文本,使其在许多行业的现实场景和应用中发挥作用。站长网2023-08-28 11:38:200000贾跃亭否认FF可能永远无法盈利:将做中美汽车间桥梁
站长之家(ChinaZ.com)5月31日消息:近日,贾跃亭针对外界关于法拉第未来(FF)盈利能力的质疑,公开表达了自己的坚定信念。他明确表示,有关“贾跃亭和FF承认公司永远无法盈利”的传闻完全不属实,这仅仅是对FF财报中风险披露部分的误解和断章取义。贾跃亭强调,这是外界试图通过低劣手段制造恐慌和造谣的行为。他坚信,法拉第未来不仅有能力实现盈利,更将成为中美汽车产业间的重要桥梁。站长网2024-06-01 20:32:040000微软高层似乎仍然不知道 Sam Altman 和 OpenAI 到底发生了什么
微软总裁BradSmith周四对有关ChatGPT开发商董事会之争的说法表示怀疑,这场争斗导致了首席执行官SamAltman的解雇和重新聘用,这场争斗是关于人工智能的一项重大进步是否对人类构成威胁。路透社上周报道称,在解雇Altman的决定做出几天前,OpenAI的研究人员曾给公司董事会写信,警告他们关于这一被报道为危险的发展。站长网2023-12-01 17:42:580000MyShell AI开发高质量语音合成工具MeloTTS 支持中英混合发音
MeloTTS是由MyShellAI开发的一个高质量的多语言文本到语音(TTS)库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言,使其在全球范围内具有广泛的应用价值。项目地址:https://top.aibase.com/tool/melotts站长网2024-02-27 11:10:360006o3被曝成绩「造假」,60多位数学泰斗集体被耍,OpenAI暗中操控,考卷提前看光
又爆大瓜!FrontierMath的o3惊人表现,竟是因OpenAI资助了EpochAI而提前获得大部分试题访问权。OpenAI模型的性能究竟几分是真,几分炒作,愈来愈变得扑朔迷离。不久前,OpenAI在「圣诞12连更」中发布的最强推理模型「o3」,毫无疑问地惊艳了所有人。尤其是对于新近发布的数学基准FrontierMath,其准确率相比o1直接翻了12倍。0000