谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频「完全真实」,尽管谷歌「为了简洁而缩短了部分内容」
站长之家(ChinaZ.com) 12 月 12 日消息:在日益激烈的生成型 AI 市场竞争中,谷歌近期推出了其大型语言模型 Gemini 的预告视频。然而,有关该视频真实性的争议随后引发了广泛关注。
谷歌发布的演示视频展示了 Gemini 模型的多模态能力,能够巧妙地解读并处理来自实时视频和音频的信息。这对谷歌来说是一项重大成就,尤其是在与 OpenAI 等竞争对手的激烈竞争中。然而,据彭博社报道,演示视频实际上是通过「使用视频的静态图像帧,并通过文本提示」制作的,而不是看似实现的实时语音和视频处理。
在旧金山举行的《财富》杂志 Brainstorm AI 会议上,谷歌助手和 Bard 的副总裁兼总经理 Sissie Hsiao 讨论了这段颇具争议的演示视频。她强调了 Gemini 作为一个模型所达到的标准,以及它将如何推动谷歌的聊天机器人 Bard 的发展。「这个视频完全真实。所有的提示和模型响应都是真实的,」Hsiao 说。「我们确实为了简洁而缩短了部分内容,这些信息也已经在视频中说明。」
演示视频展示了新 AI 模型识别一条波浪线,然后识别新线的曲线,最终绘制出一只鸭子的图画的多模态能力。在整个过程中,模型持续识别每个元素,实时提供与鸭子相关的事实和答案。
Hsiao 突出了 Gemini 在各种基准测试中的成就,这些测试包括高中物理、专业法律难题和道德场景。据 The Verge 报道,Gemini Ultra 在 32 项基准测试中击败了 OpenAI 的 GPT-4,共赢得了 30 项测试,这是一个值得夸耀的成就,尽管 Gemini Ultra 直到明年才会发布。目前,Bard 使用的是不那么先进的 Gemini Pro,大致相当于 GPT 3.5。
Hsiao 表示,这些 Gemini 模型将继续改进谷歌搜索以及谷歌 Bard 聊天机器人,后者据她所说是「目前市场上最受欢迎的免费聊天机器人。」
背靠10亿用户,视频号如何做好内容生态?
斯蒂芬·茨威格在《人类的群星闪耀时》中写道,那些历史的尖峰时刻都需要太长的酝酿时间每一桩影响深远的事件都需要一个发展的过程。站长网2023-07-10 09:15:520000科学家在非手性体系中实现手性吸附与手性放大
站长网2023-05-24 18:23:130000解决Sora物理bug!四所美国顶尖高校联合发布PhysDreamer模型
Sora视频生成器发布后不久,就被网友发现存在物理交互的bug,例如模型对物理世界的理解不足,导致小狗走路时前腿出现不自然的交错问题。为了解决这一问题,提升视频生成的真实感,来自MIT、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员联合提出了一种基于物理的方法模型——PhysDreamer。项目地址:https://top.aibase.com/tool/physdreamer站长网2024-05-06 20:34:460000微信:有零钱的账号不会被系统注销
日前,网上有传言称,微信号长期没有使用被注销,账号有200元钱被收走,对此腾讯官方作出了回应。腾讯微信团队微博发文表示,微信有零钱的微信号就不会被注销。不过微信方面强调,为保障用户的微信账号安全,注册后不活跃,长期未登录,并且没有零钱的微信账号,会被系统注销,无法使用。站长网2023-07-18 06:37:230000谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
谷歌VideoPoet项目ResearchLead,CMU兼职教授蒋路的GoogleScholar资料显示已加入TikTok。最近,有传闻TikTok招募了某篇论文的作者作为北美技术部门负责人,研发能和Sora对抗的视频生成AI。而蒋路3周前在Linkedin上发布了离职谷歌的消息,也向外界揭开了谜底。站长网2024-02-22 09:22:150001