ChatGPT 还是谷歌 Gemini 更好?新 AI 模型尽管性能卓越但面临现实应用的挑战
谷歌最近推出了一款名为 Gemini 的新型人工智能模型,并试图通过一份报告证明其优于 OpenAI 的 GPT-4。根据谷歌首席执行官 Sundar Pichai 联合撰写的一篇博客文章,Gemini 在 32 项学术基准测试中的 30 项中表现优于 GPT-4,包括数学、阅读、编程和推理测试。
尽管 Gemini 相较于今年年初谷歌的 AI 发展有了巨大提升,但在许多测试中仅以微弱优势领先 OpenAI 的模型,这让其自夸显得有些迫切。
真的有人会因为 Google 在代数技能评估中得分高出 0.3% 而从 ChatGPT 转向 Bard 吗?
这些测试成绩是否真的能促使用户从 ChatGPT 转向 Bard 还是个疑问。随着众多 AI 产品试图区分自己,比较点变得越来越抽象,以至于几乎毫无意义。例如,百度和 Meta 平台等科技巨头强调他们的大型语言模型拥有数十亿甚至数万亿的参数,而初创公司则夸耀其系统摄取了数以百万计的内容。
即便是领域专家对这类评估也持谨慎态度。OpenAI 研究员 Rowan Zellers 在社交网络 X 上发文称,对于目前十多个文本基准的信任程度并没有很好的判断。
Gemini 在实际应用中的表现比这些测试成绩更重要,用户迅速指出该系统仍容易出错,看起来并不比 OpenAI 的产品更好。谷歌自己在解释 Gemini 成绩对公众意味着什么时也遇到困难,称该模型是其迄今为止「最灵活」、「最有能力」和「最大」的模型。
Gemini 有三个不同的版本——Ultra、Pro 和 Nano——甚至谷歌的 Bard 也难以识别。当用户询问聊天机器人有关新的 Gemini 模型时,它将其引向了各种名为 Gemini Pro 的产品,包括高光地板涂料、便携式 PA 系统和压花机。
过度的基准测试有点像 PC 时代的规格战争。数十年前,计算机制造商通过处理器速度和内存大小等技术指标来推广其硬件。苹果公司被认为是将焦点转移到展示产品如何改善日常生活的新颖特性上。当史蒂夫·乔布斯首次推出 iPod 时,其千兆字节存储空间不如「1,000 首歌在你口袋里」的承诺重要。
AI 公司的问题在于,由于他们的软件声称几乎可以做任何事情,因此很难确切地区分特定产品的特点。例如,埃隆·马斯克将 xAI 的 Grok 定位为 anti-woke 的替代品,而 X 公司 CEO Linda Yaccarino 称其为「终极挚友」(不管这意味着什么)。
谷歌最明确的差异化特征在于其 Bard 的「多模态」功能演示中展示,即用户可以通过文本输入之外的方式与机器交互。在一个示例中,Bard 看到了一张分叉道路的图片,路线通向一只鸭子或熊的涂鸦。当被问及路口另一只鸭子应该走哪个方向时,Bard 正确猜测最安全的路径是朝向同类。
但谷歌后来承认,该演示有些作假,基于尚未发布的 Gemini 版本。当用户在 Bard 上进行相同测试时,它奇怪地建议鸭子应该骑自行车向南行驶 100 英里到罗德岛州。另一方面,ChatGPT 则完美地回答了这个提示。
对于这个问题,谷歌需要更加努力才能获得及格分数。
百度推出手表版AI产品“手表AI”APP
据Tech星球报道,近期,百度旗下小度推出了一款名为“手表AI”的产品,旨在为用户提供手表聊天AI与AI生活助手。该产品采用了AI模型来进行信息回复和聊天,用户可在手表上体验人工智能信息对话平台,并使用自然语音获取想要的信息。目前,“手表AI”已经推出了iWatch版本,用户可通过手表内安装的“手表AI”APP进行聊天和信息咨询等AI聊天服务。站长网2023-05-25 14:23:430000韩国将把AI引入中小学课程 先应用于数学、英语和IT
据报导,韩国教育部正在推动使用人工智能技术对学生进行教学。其计划主要包括使用AI应用程序回答学生的提问和电子课本。此外,AI还将被用于分析学生的优势和不足,并提供量身定制的教学策略。站长网2023-06-13 14:58:480000百度造车调整,小米没提造车
最近的新能源汽车市场真是云波诡谲。先是前几天比亚迪喊在一起,众品牌响应,但长城汽车言辞激烈不想在一起;昨天到今天又有三件事值得关注:恒大汽车融资了,雷军onemorething没提小米汽车,百度不再独立造车了。重点聊聊百度和小米的造车。01百度造车之变:因资质,还是梦醒站长网2023-08-16 15:02:140000IBM加倍投入企业AI,发布 Watsonx 助手、模型更新
划重点:⭐IBM在其Watsonx平台上发布了新的助手工具和第三方模型,以加强对企业AI的支持。⭐公司承诺更广泛地支持开源AI,并将其Granite大型语言模型开源,以推动企业环境中AI的应用。⭐IBM还展示了Watsonx的新模型和工具,以及其对企业AI的持续关注和承诺。站长网2024-05-22 22:21:210001科技界“教父”表示:对AI公司造成的伤害必须追究责任
划重点:1.两位“科技教父”,警告强大的人工智能系统威胁社会稳定,要求AI公司对其产品造成的危害负有责任。2.他们强调,在进行更强大的人工智能系统开发之前,应首先了解如何确保其安全。3.政策建议包括政府将三分之一的AI研发资金分配给安全和道德使用。站长网2023-10-24 22:56:510000