Gemini 是谷歌迄今为止最佳的 AI 模型 但充满希望的基准测试和演示最终引发了批评
谷歌近日公布了其最新的人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了谷歌的自信。
然而,随着 AI 工程师和爱好者深入探究细节后发现了一些缺陷,这股积极氛围逐渐转变。虽然「Gemini」在技术上令人印象深刻,有望最终挑战 GPT-4 的主导地位,但谷歌模糊不清的信息传达方式使其不得不处于防守状态。
北美某大型零售商的首席 AI 工程师 Emma Matthies 表示:「目前问题多于答案。我发现谷歌宣传视频中的展示与其技术博客中的细节之间存在不一致。」
谷歌陷入困境的演示
Gemini 的演示视频在 YouTube 上发布,题为「亲身体验 Gemini」,视频风格快节奏、友好、有趣,充满易于理解的视觉示例。然而,它对「Gemini」的工作原理有所夸大。谷歌代表声称该演示视频展示了「Gemini」的真实提示和输出,但编辑过程省略了一些细节。例如,与「Gemini」的互动是通过文本进行的,而不是语音,AI 解决的视觉问题是通过图片输入的,而不是实时视频。
此外,AI 开发者迅速意识到「Gemini」的能力并不如最初看起来那样革命性。
性能比较
谷歌在其基准测试数据上也受到批评。家族中最大的模型「Gemini Ultra」宣称在多种基准测试中超越 GPT-4,这在大体上是正确的,但引用的数据是为了将「Gemini」描绘得更加优秀。
谷歌使用与其他公司不同的方法来测量性能,用户提示 AI 模型的方式会影响其性能,只有在使用相同的提示策略时,结果才具有可比性。
尽管如此,「Gemini」的多模态功能仍然令人印象深刻。它能够跨文本、图像、音频、代码和其他媒介进行推理。虽然这并非「Gemini」所独有,但大多数多模态模型要么未公开,要么使用困难,或专注于特定任务。这使 OpenAI 的 GPT-4 在这一领域中占据主导地位。
未来展望
「Gemini」的命运尚未确定,取决于两个未知因素:「Gemini Ultra」的发布日期以及 OpenAI 的 GPT-5。
尽管用户现在可以尝试「Gemini Pro」,但其更强大的兄弟版本将于 2024 年某时发布。AI 领域的快速发展使得人们很难预测 Ultra 发布时的情况,同时也给了 OpenAI 足够的时间来用新模型或对 GPT-4 的适度改进作出回应。
香港大学和微软推高效声音转换方法CoMoSVC 歌声随意切换
CoMoSVC是一种能够将一个人的歌声转换成另一个人的歌声的创新技术。这个项目是由香港大学和微软亚洲研究员共同开发的,它在高质量音频转换和快速处理速度之间找到了平衡,是语音转换领域的重大进步。站长网2024-01-04 15:31:450000视频号做IP的四种硬核赚钱玩法
“微信是互联网时代的身份证,视频号就是互联网时代的个人名片。”十点读书副总裁廖仕健在此前一次面向见实会员的视频号主题私享会上如是说道。随着微信生态的不断发展,视频号逐渐成为了商家和创作者们关注的焦点。它不仅提供了丰富的创作工具和展示平台,还为商业变现提供了多种途径。在这个过程中,视频号的商业化发展也呈现出一些显著的特点和趋势。在日常观察中,廖仕健就发现知识博主在视频号有4种赚钱硬核玩法。站长网2023-11-03 09:13:480000小米SU7重磅OTA更新来了!新增无线Apple CarPlay、走哪问哪功能
快科技5月17日消息,今日小米汽车宣布,小米SU7迎来OTA更新,版本号为XiaomiHyperOS1.1.2,现已陆续推送中。此次更新,小米澎湃智能座舱新增无线AppleCarPlay。iPhone用户可以通过无线连接方式使用AppleCarPlay,通过Siri语音助手控制AppleCarPlay界面,操作电话、音乐、导航等功能,并支持在HUD中显示苹果原生地图导航的卡片界面。站长网2024-05-17 15:26:310000《妈妈咪呀》国际女星一夜被AI端掉饭碗
AI淘汰人类的紧迫感越来越近了!最近,在音乐剧《妈妈咪呀》饰演主角女星,被一封BBC邮件告知:不用来了,AI替代了你。前几天,OpenAI刚宣布进军好莱坞,并放出一波导演艺术家们体验Sora的震撼视频。仅仅几天的时间,已经有国际著名明星,饭碗一夜之间被AI端掉了!她,就是音乐剧《妈妈咪呀》的主演——SaraPoyzer。站长网2024-04-06 14:18:250000