UC伯克利研究者推大世界模型(LWM) 与Gemini 1.5 Pro能力相当
最近,谷歌的Gemini1.5和OpenAI的Sora模型引发热议,但这些模型是否真的能很好地理解世界?以Sora为例,虽然给人们带来了惊喜,但在模拟复杂物理原理方面存在一定局限性,如健身男子倒跑跑步机。随着大型模型的发展,固有的缺点也显现出来,模型在处理现实世界难以用语言描述的内容时表现困难,长程任务也难以处理。
因此,视频模型的出现在一定程度上弥补了这一问题,提供了语言和静态图像所缺少的时间信息,为大型语言模型(LLM)的发展带来新的可能性。然而,由于内存限制、计算复杂性和有限的数据集,从数百万个视频和语言序列的token中学习仍然具有挑战性。
项目地址:https://top.aibase.com/tool/large-world-models
为了解决这些挑战,来自UC伯克利的研究者推出了大世界模型(LWM),利用RingAttention技术对长序列进行可扩展训练,这是一个带有视频生成功能的多模态模型,非常强大,与Gemini1.5Pro的能力相当。这个模型支持100万上下文的文本检索,可以分析超过1小时的视频,并支持视频和图片生成。
该研究在长视频和语言序列上训练了一个具有极大上下文尺寸的transformers模型,为新的检索任务和长视频理解设立了新的标杆。
通过RingAttention、掩码序列打包等方法,研究团队成功训练了数百万长度的多模态序列,提供了处理超过100万token长文本文档和视频的完全开源模型。LWM模型不仅可以根据文本提示生成图像和视频,还能深入理解图片、回答关于图片的问题,表现出优越的长视频理解能力。
总的来说,LWM模型在长视频问题回答方面表现优于业界其他模型,包括谷歌的Gemini Pro和OpenAI的GPT-4。研究者通过多种策略克服了视觉-语言训练的挑战,为处理长视频与语言序列提供了新的思路,如损失加权和使用模型生成的问答数据。该研究的推出将为语言模型更好地理解物理世界打开新的可能性,为人工智能技术的发展带来新的契机。
OpenAI在都柏林设立办公室 推进人工智能发展和应用
OpenAI宣布在都柏林设立办公室,他们希望与爱尔兰政府合作,支持其国家人工智能战略,并与行业、初创企业和研究人员合作,了解推进人工智能发展和应用的优先事项和想法。OpenAI还与爱尔兰的非营利组织Patch合作,为16-21岁的年轻人提供技术访问和指导。站长网2023-09-14 21:38:090000苏宁易购618将于5月26日晚8点开启预售
今日,苏宁易购发布“618家电新底价计划”,全面开启2023年618大促。据了解,苏宁易购618将于5月26日晚8点开启预售,覆盖开门红、超级秒杀日、超级会员日、超级新品日、抢冰洗、家电省钱风暴、最终爆发期等多个双线促销节点。站长网2023-05-24 16:46:340000母亲节今天到来!微信上线限时状态:感谢妈妈
快科技5月14日消息,今天是5月的第二个星期日,也迎来了一年一度的母亲节,在这个特殊日子,人们用各种方式来表达对母亲的敬爱之情。快科技在微信中发现,在母亲节这天,微信上线全新限时状态感谢妈妈”,状态图标展现的一个小人手中送出爱心。与其他普通常驻状态一样,母亲节状态设置后为24小时可见,由于是节日限定,因此该状态也只有今天一天时间来设置,各位可在微信我”的界面点击状态”选择。站长网2023-05-14 09:23:560000中消协点名车企售后服务停摆 消协智慧315平台上线
据央视新闻报道,3月15日,中国消费者协会公布2023年十大消费维权舆情热点,涉及以下消费维权突出问题。电商主播言行不当引发投诉民宿经营者被曝“涨价退单”“虚假地址”餐饮商家不明确收费标准及服务内容“研学游”“低价游”欺骗诱导暗藏陷阱车企售后服务停摆引发车主担忧共享按摩椅及共享充电宝消费体验不佳第三方测评“跑偏”干扰消费者“生鲜灯”改变商品外观误导消费者知名品牌触碰食品安全底线站长网2024-03-15 14:44:160000IBM 宣布收购 Manta 软件公司以补充数据和人工智能治理能力
站长之家(ChinaZ.com)10月25日消息:IBM发布新闻稿宣布,已经收购了Manta软件公司——一个世界一流的数据溯源平台,以补充其在watsonx.ai、watsonx.data和watsonx.governance中的能力,并帮助企业交付基于信任和透明原则构建的产品。图片来自IBM站长网2023-10-25 18:21:080000