能耗比达到GPT-4 10倍!黄学东亲自解密Zoom AI的成功之道,AI伴侣直接替你开会
近日,AI大佬,现任Zoom CTO的黄学东,在自家的官网上发表了一篇博客。
其中隆重介绍了自己加入Zoom六个月之后创新的成果——Zoom AI Companion,以及驱动Zoom AI Companion的Zoom联邦(federated approach)AI。
在Zoom之前,黄学东曾担任微软Azure AI首席技术官,他不仅是微软首位全球华人技术院士,也是微软最高级别的华人科学家。
黄学东在微软任职了超过30年,在他的牵线搭桥下,微软于1998年在北京建起第一个亚洲研究院。
在2017年和2020年,黄学东分别当选ACM和IEEE会士,并于2023年同时当选美国国家工程院院士和美国艺术与科学院院士。
黄学东表示,人工智能从概念化到实现的转型之旅,就像一条曲折的道路,充满了不断的破坏、适应和创新。
「在过去的30年里,我一直走在这条道路上,从语音识别、自然语言理解,到计算机视觉。在我加入 Zoom 的过去六个月里,创新的步伐尤其令人震惊。」
Zoom联邦AI,用合适的AI跑合适的任务
Zoom希望使用AI来改善人类协作方式,不断提高生产力。
多年来,Zoom一直在为客户提供语音识别、计算机视觉、机器翻译和大型语言模型(LLM)等AI服务,以增强自家软件的竞争力。
他们的最新产品Zoom AI Companion,旨在帮助用户提高工作效率、促进无缝协作并获得更深入的交流和见解。
Zoom的联邦AI,能够使用户在之前付费服务的基础上,不用额外花钱就能享受AI Companion的功能。
这样能够大大提升用户的体验,还能快速提高新技术的在用户中的渗透率。
但是对于Zoom这样拥有大量用户,高强度使用AI功能的软件,LLM推理的额外成本怎么负担呢?
要知道,GitHub的Copilot被传说,每月收费10刀,依然每个用户每月还要补贴20刀。
Zoom目前使用的LLM包括自有模型和第三方的模型(如OpenAI GPT-3.5和GPT-4,以及Anthropic Claude2)。
Zoom联邦AI,可以整合来自合作伙伴的最新的LLM技术(例如OpenAI最新发布的GPT-4Turbo),进一步改善Zoom客户的端到端体验。
Zoom采用了具有更好成本效益的策略:
首先使用合适的低成本LLM来完成任务,然后通过Z-Scorer评估初始任务完成质量。
在有需要的情况下,Zoom会使用更高级的LLM, 对初始LLM所获得的成果进行改进。
——这类似于一个有凝聚力的团队协同工作,能够比一个人更高效地生产更高质量的产品。
根据Zoom的内部测试,与OpenAI GPT-3.5Turbo或其他几种最先进的LLM相比,Zoom采用联邦AI提高了AI Companion的输出质量,还有效地控制了成本。
黄学东表示,他们衡量性能的标准是更低的成本、更快的响应时间和更高质量的输出。
上图是Zoom AI Companion与GPT-4在英文会议查询任务上的性能和成本对比。
图中比较的两个关键指标为成本和输出质量。
Zoom AI Companion只用了不到GPT-46%的成本,就能达到几乎相当的输出质量。
与微软Copilot使用的GPT-4-32k模型相比,Zoom AI Companion的会议提问功能,可降低成本,加快响应速度,同时保持相当的输出质量。
上图是Zoom AI Companion与GPT-4在多语言会议摘要任务上的对比。
此外,AI Companion的多语言性能,进一步证明了Zoom联邦AI的强大功能,支持除英语之外的32种语言。
由于大多数LLM主要是使用英语数据进行预训练,所以Zoom增加了翻译模型来扩展多语言能力。
上图对比了Zoom AI Companion与Microsoft Copilot在多语言会议摘要任务中的表现,同样使用GPT-4作为Microsoft Copilot的代理来进行对比。
在Zoom AI Companion的多语言会议摘要中,使用Zoom的翻译模型将非英语文本翻译成英语,这样能同时考虑翻译数据与原始数据。
从图中可以看出,Zoom AI Companion以不到6%的成本完成了质量接近于GPT-4-32k的输出(97%)。
Zoom相信,人工智能的好处应该让尽可能多的人广泛使用,而Zoom的联邦AI能够无缝结合不同AI系统的优势,提供高性能结果,在实现这一愿景方面发挥着重要作用。
Zoom AI Companion,最智能的会议助手
而Zoom现在几乎所有AI功能的入口,都集中在了他们9月底推出的Zoom AI Companion上。
作为Zoom提供的「充值服务」,它利用Zoom提供的AI能力,能帮助你在中途加入会议之后,自动总结错过的会议内容。
然后轮到你发言时,结合你的观点和之前会议的内容,生成发言稿,真的做到了「替代用户开会」。
在半程加入会议之后,AI可以告诉你会议的重点。
还能帮你实时转录翻译其他参会者发言,一键获取会议讨论文本。
AI还能帮你把碎片化的信息归纳出来,最后为团队生成会议总结和记录。
还能把Zoom平台上获得的客户短信息进行总结,生成具体的执行方案。
而且对于参加不了的会议,还可以在日程表上直接安排AI智能录制,之后分段分重点回看。
而这整个AI伴侣背后,都凝结了Zoom和黄学东联邦AI的技术思路,用合适的AI资源去处理合适的请求。
而且Zoom承诺,不会使用用户的任何音频、视频、聊天、屏幕共享、附件或客户生成的内容(例如投票结果、白板)等其他数据来训练Zoom或第三方的AI。
这么多好用的功能,这么负责的AI,需要花多少钱呢?
150刀到200刀就能用一年,企业用户还有专门的定制版本。
ACG社区半次元停服 7月12日起停止运营及服务
国内二次元爱好者社区“半次元”发布停服公告称,因公司业务发展上的调整,将于2023年7月12日起停止运营及服务,请在该日前尽快完成钱包余额提现及个人信息的下载与保存。半次元还表示,停止运营后,将在法律规定的保存期限届满后依法删除用户个人信息,届时将无法查询及下载个人信息。站长网2023-06-13 14:58:500000HandRefiner:解决AI生图手部畸形难题
HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面,目前的图像生成模型已经非常出色,但是在生成人类手部的图像时常常会出现问题,例如手指数量不对或者手形怪异。为了解决这个问题,HandRefiner提出了一种条件修补方法,可以在不改变图片其他部分的情况下,修正那些形状不正常的手部图像。站长网2024-01-04 11:30:510003罗永浩称车企一把手们是笑面虎:吐槽北京车展CEO互捧
罗永浩对北京车展车企CEO间亲密互动的真实性提出质疑,这一观点迅速在网络上引发了热烈讨论。在2024年的北京车展上,小米的雷军和360的周鸿祎无疑成为了备受瞩目的焦点人物。不过,除了他们之外,其他车企的领军人物,如比亚迪的王传福、理想汽车的李想、蔚来的李斌、小鹏汽车的何小鹏等也悉数登场,共同为这场行业盛宴增添了不少色彩。站长网2024-04-29 18:42:060000Google Assistant 即将集成 Bard AI:用户可选择经典或 AI 增强版本
Google正在为其移动设备上的Assistant集成新的AI功能,即将推出名为「ClassicAssistant」的版本。站长网2023-11-24 10:46:180000谷歌发布Gemini 1.5技术报告 详细介绍Gemini 1.5 Pro模型架构改进情况
GoogleDeepMind发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro和Gemini1.5Flash两个模型的性能特点和架构以及这个多模态大型模型的最新进展。Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显著提升了性能和速度。该模型具有更长的上下文理解能力、更强的推理能力,能够处理跨模态内容。报告中提到了两个新型号:站长网2024-05-20 11:04:530001