ChatGPT 还是谷歌 Gemini 更好?新 AI 模型尽管性能卓越但面临现实应用的挑战
谷歌最近推出了一款名为 Gemini 的新型人工智能模型,并试图通过一份报告证明其优于 OpenAI 的 GPT-4。根据谷歌首席执行官 Sundar Pichai 联合撰写的一篇博客文章,Gemini 在 32 项学术基准测试中的 30 项中表现优于 GPT-4,包括数学、阅读、编程和推理测试。
尽管 Gemini 相较于今年年初谷歌的 AI 发展有了巨大提升,但在许多测试中仅以微弱优势领先 OpenAI 的模型,这让其自夸显得有些迫切。
真的有人会因为 Google 在代数技能评估中得分高出 0.3% 而从 ChatGPT 转向 Bard 吗?
这些测试成绩是否真的能促使用户从 ChatGPT 转向 Bard 还是个疑问。随着众多 AI 产品试图区分自己,比较点变得越来越抽象,以至于几乎毫无意义。例如,百度和 Meta 平台等科技巨头强调他们的大型语言模型拥有数十亿甚至数万亿的参数,而初创公司则夸耀其系统摄取了数以百万计的内容。
即便是领域专家对这类评估也持谨慎态度。OpenAI 研究员 Rowan Zellers 在社交网络 X 上发文称,对于目前十多个文本基准的信任程度并没有很好的判断。
Gemini 在实际应用中的表现比这些测试成绩更重要,用户迅速指出该系统仍容易出错,看起来并不比 OpenAI 的产品更好。谷歌自己在解释 Gemini 成绩对公众意味着什么时也遇到困难,称该模型是其迄今为止「最灵活」、「最有能力」和「最大」的模型。
Gemini 有三个不同的版本——Ultra、Pro 和 Nano——甚至谷歌的 Bard 也难以识别。当用户询问聊天机器人有关新的 Gemini 模型时,它将其引向了各种名为 Gemini Pro 的产品,包括高光地板涂料、便携式 PA 系统和压花机。
过度的基准测试有点像 PC 时代的规格战争。数十年前,计算机制造商通过处理器速度和内存大小等技术指标来推广其硬件。苹果公司被认为是将焦点转移到展示产品如何改善日常生活的新颖特性上。当史蒂夫·乔布斯首次推出 iPod 时,其千兆字节存储空间不如「1,000 首歌在你口袋里」的承诺重要。
AI 公司的问题在于,由于他们的软件声称几乎可以做任何事情,因此很难确切地区分特定产品的特点。例如,埃隆·马斯克将 xAI 的 Grok 定位为 anti-woke 的替代品,而 X 公司 CEO Linda Yaccarino 称其为「终极挚友」(不管这意味着什么)。
谷歌最明确的差异化特征在于其 Bard 的「多模态」功能演示中展示,即用户可以通过文本输入之外的方式与机器交互。在一个示例中,Bard 看到了一张分叉道路的图片,路线通向一只鸭子或熊的涂鸦。当被问及路口另一只鸭子应该走哪个方向时,Bard 正确猜测最安全的路径是朝向同类。
但谷歌后来承认,该演示有些作假,基于尚未发布的 Gemini 版本。当用户在 Bard 上进行相同测试时,它奇怪地建议鸭子应该骑自行车向南行驶 100 英里到罗德岛州。另一方面,ChatGPT 则完美地回答了这个提示。
对于这个问题,谷歌需要更加努力才能获得及格分数。
赛力斯回应华为成立智能汽车新公司:已收到共同投资邀请
昨日,针对华为与长安汽车签署《投资合作备忘录》,共同支持设立一家从事汽车智能系统及部件解决方案研发、设计、生产、销售和服务的公司一事。赛力斯回应称,华为的这次战略调整不影响双方长期的战略合作伙伴关系、零部件供货关系以及为AITO问界车主和潜在用户持续提供产品和服务。站长网2023-11-27 08:40:310000知网等将共同研发“儿科虚拟患者大模型”产品
12月20日,同方知网(北京)技术有限公司(以下简称同方知网)与首都医科大学附属北京儿童医院(以下简称北京儿童医院)、北京思普科软件股份有限公司(以下简称思普科)签署战略合作协议,三方将就“儿科虚拟患者大模型”开展深入合作。0000Sora文生视频火爆出圈!清华大学公布文生视频专利
快科技2月20日消息,2月16日,OpenAI发布其首款文生视频大模型Sora。Sora可根据文字提示生成60秒视频,输出视频堪比影视CG,一经发布火爆出圈。据国家知识产权局网站显示,2月2日,清华大学申请的一种定制化多主体文生视频方法、装置、设备及介质”专利公布。专利摘要显示,该申请提供一种定制化多主体文生视频方法、装置、设备及介质,涉及神经网络技术领域。站长网2024-02-20 22:51:260000任正非称华为产品不够先进不会拿出来卖:卖不了高价 养不活队伍
近日,任正非在与南开大学新闻与传播学院院长刘亚东的访谈中透露了华为当前的经营状况和发展思路。任正非强调,华为不会拿出不够先进的产品进行销售,卖不了高价,我也养不活队伍。他坦言,在当前严峻的外部环境下,华为将面临越来越多的困难,但同时也将迎来更加繁荣的局面。站长网2023-09-22 09:58:390001阿联酋科技集团G42推出开源阿拉伯语AI模型Jais
文章概要:1.一群工程师、研究人员和一家硅谷芯片公司合作,发布了先进的阿拉伯语软件,可以为生成式AI应用提供支持。2.新的大语言模型Jais包含130亿参数,是从大量阿拉伯语和英语数据中训练出来的。3.Jais将以开源许可方式提供。最近,一群工程师、研究人员以及硅谷的芯片公司CerebrasSystems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。站长网2023-08-30 15:22:030000