DeepMind发布新模型Mirasol3B:更高效处理音频、视频数据
**划重点:**
1. 🌐 Google DeepMind发布Mirasol3B,致力于改善对长视频输入的理解。
2. 🎥 Mirasol3B采用先进的多模态学习,同时处理音频、视频和文本数据。
3. 🤔 对于应用于实际场景的可行性存在疑问,但该技术在YouTube等领域可能带来革命性的变化。
Google DeepMind日前悄然宣布了其人工智能研究的重大进展,推出了一款名为“Mirasol3B”的新型自回归模型,旨在提升对长视频输入的理解能力。该新模型展示了一种颠覆性的多模态学习方法,以更综合和高效的方式处理音频、视频和文本数据。
Google Research的软件工程师Isaac Noble和Google DeepMind的研究科学家Anelia Angelova共同撰写的博客文章中指出,构建多模态模型的挑战在于模态的异构性。他们解释说:“一些模态可能在时间上同步(例如音频、视频),但与文本不对齐。此外,视频和音频信号中的大量数据远远大于文本,因此在将它们结合在多模态模型中时,视频和音频通常无法完全消耗,需要进行不成比例的压缩。对于更长的视频输入,这一问题变得更加严重。”
多模态学习的新方法
为了解决这一复杂性,Google的Mirasol3B模型将多模态建模解耦为分开的自回归模型,根据模态的特性处理输入。“我们的模型包括一个用于时间同步模态(音频和视频)的自回归组件,以及一个用于不一定时间对齐但仍然是序列的模态(例如标题或描述)的单独的自回归组件,”Noble和Angelova解释道。
Google可能会探索在YouTube等领域应用该模型的可能性。作为全球最大的在线视频平台之一,YouTube是公司的主要收入来源之一。该模型理论上可以用于提升用户体验和参与度,例如生成视频的字幕和摘要,回答问题并提供反馈,创建个性化推荐和广告,以及让用户使用多模态输入和输出创建和编辑自己的视频。
例如,该模型可以基于视觉和音频内容生成视频的字幕和摘要,并允许用户通过关键词、主题或情感搜索和过滤视频。这有望提高视频的可访问性和可发现性,帮助用户更轻松快速地找到他们想要的内容。
该消息在人工智能社区引起了浓厚的兴趣和激动,同时也有一些怀疑和批评。一些专家赞扬了该模型的多功能性和可扩展性,并对其在各个领域的潜在应用寄予厚望。但也有人质疑为何没有提供代码、模型权重、训练数据甚至API。这引发了关于该技术在实际应用中的可行性的讨论。
这一宣布标志着人工智能和机器学习领域的重要里程碑,展示了Google在开发前沿技术方面的雄心和领导地位。然而,这也为AI的研究人员、开发者、监管机构和用户提供了一项挑战和机会,需要确保该模型及其应用符合社会的道德、社会和环境价值观和标准。
科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型
**划重点:**1.🌐科学家使用世界最强大的超级计算机的仅8%算力,成功训练出ChatGPT规模的模型。2.🚀OakRidgeNationalLaboratory的研究团队在Frontier超级计算机上使用创新技术,仅用数千个AMDGPU训练了一个拥有万亿参数的语言模型。0000华为Mate 60 Pro宣布开启“90天预约申购”
华为官方宣布,自明日开始,华为Mate60Pro将开启90天的预约申购活动,订单将按照随机顺序发货。此举旨在让更多消费者能够体验到这款备受喜爱的产品。华为商城表示,自“先锋计划”推出以来,华为Mate60Pro深受大家喜爱。现在,为了让更多消费者能够体验到我们的产品,华为商城将于11月6日12:08开启90天预约申购。站长网2023-11-05 14:47:130000五天日流水破万,娱乐直播间如何借视频“宫格”从0起航?
“终于开播啦!今天是和谁连麦?”“上班抽空来看辣椒。”“主播好帅啊。”虽然是工作日的下午,@Ry差生补习班/交友CP的直播间内却是一派热闹。8位主播在主持人的协调下,进行着“萝卜蹲”的经典游戏,屏幕外的粉丝们也积极刷着弹幕和礼物,向自己支持的主播表达喜爱。开播还不到十分钟,直播间就登上了山西榜人气第一的位置。站长网2023-05-27 09:51:320001淘宝回应上线微信支付:部分用户可用 正逐步开放
近日,有网友反馈称在自己的淘宝App支付页面出现了“微信扫码支付”选项,这一变化引起了广泛关注和讨论。根据微博博主“读秒财经”向淘宝客服询问得到的回应,微信扫码支付功能正在逐步开放,但目前仅针对部分用户开放,而且只有部分商品支持这一支付方式。具体能否使用以页面显示为准。据了解,目前在淘宝使用微信支付必须通过二维码,需要用户先保存支付二维码,再用微信扫码付款,操作相对较为复杂。站长网2023-10-16 23:51:100000梁建章喊话携程员工来领育儿补贴:每生一个孩子发5万元奖励
在2024年ESG全球领导者峰会上,携程集团董事局主席梁建章宣布了一项重大的员工福利政策:为每位员工生育的子女提供5万元人民币的奖励。为此,携程已经预备了高达10亿元人民币的资金。梁建章表示,他期望这一措施能够吸引政府的关注,并促进政府推出更多鼓励生育的政策。梁建章还提出了推广居家办公的建议,认为这样做可以实现社会、员工和公司三方的共赢局面。0000