开源世界模型LWM :百万级上下文,长视频理解超GPT-4
划重点:
⭐️ UC 伯克利研究人员开源首个世界模型,具有百万级上下文处理能力。
⭐️ 该模型在多模态任务中表现出色,长视频理解效果优于 GPT-4V 和 Gemini Pro。
⭐️ LWM 系列模型在 GitHub 上受到广泛关注,开发者积极参与并获得高星数。
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M token。
在实验中,LWM 系列模型展现出了优异的多模态性能,在文本图像生成、文本视频生成以及基于图像的对话等任务中表现出色。
研究人员指出,LWM 系列模型的多模态能力优于目前商业模型 GPT-4V 和 Gemini Pro,在处理超长视频理解方面尤为出色。更令人振奋的是,LWM 是一款开源模型,基于 Llama27B,受到了开发者们的热烈欢迎,仅在不到两周的时间里,就在 GitHub 上获得了超过6.2k 的 star。
该模型的训练过程分为两个阶段,首先是上下文扩展阶段,主要利用 Books3数据集将上下文长度从32K 扩展到1M。第二阶段是视觉语言培训,通过联合训练长视频和语言序列,提高模型在多模态任务中的表现。研究人员还对不同长度的文本和视频数据进行了逐步训练,并在模型设计和训练过程中做出了相应调整和优化。
这一开源的世界模型展示了强大的多模态处理能力,为相关领域的研究和开发提供了重要参考。其优秀的性能表现和开源特性吸引了众多开发者的关注和参与,为人工智能领域的进步和创新带来了新的契机。
论文地址:https://arxiv.org/pdf/2402.08268.pdf
项目入口:https://github.com/LargeWorldModel/LWM
网易游戏推AI巡逻员 用大模型监控未成年人防沉迷
据澎湃新闻报道,网易游戏在游戏行业首次推出AI巡逻员提高未成年风险行为识别准确率,借助AI大模型技术对未成年保护体系进行升级,防止未成年人沉迷游戏。财报显示,2023年第一季度网易的净营收为2504.63亿元,而上一季度和去年同期分别为2535.41亿元和2355.58亿元。季度内,网易继续投入AI大模型等自研关键技术,Q1研发投入37亿元,研发投入占比营收达15%。站长网2023-06-29 11:44:110001量化巨头,决战“AI炒股”?
AI热潮,传入投资圈。日前,量化赛道头部玩家幻方量化发布公告,称将集中资源和力量,全力投身到服务于全人类共同利益的人工智能技术之中,探索AGI(人工通用智能)的本质。“我们可能站在这个时代最伟大变革的前夜。人工智能出现的70年后,第一次涌现出令人惊叹的智慧,新纪元的大门打开了。”幻方量化称。这意味着,幻方量化将AllinAI。站长网2023-04-25 16:52:360000AI对联/春联在网络上走红 打工人又被狠狠共情了
最近,智能春联生成器AI对联/春联在网络上走红,不少网友纷纷以“A股”“打工人”等为题让AI生成对应的春联。还别说,就从“程序维护忙像狗”“千股跌停迎新春”这些对联来看,AI已经拿捏了普通人的心理。项目地址:https://github.com/YunYouJun/ai-sfc体验地址:https://top.aibase.com/tool/aichunlianshengchengqi站长网2024-02-05 14:10:280000Opera浏览器推出升级版的AI工具Aria
要点:1.Opera浏览器推出升级版的AI工具Aria,使用户能够更轻松地与AI互动,优化查询和创作内容。2.Aria的新工具“Refiner”具备“重用”和“改述”功能,用户可以根据以前的回答元素来改进AI的回应。3.用户还可以使用Aria的“高亮器”功能来标记需要后续处理的元素,以及通过“我的风格”功能训练AI以模仿其写作风格。站长网2023-10-11 16:41:260000字节跳动 “AI作业助手” Gauth在美国教育应用下载量排名第二
划重点:⭐️Gauth成为美国教育应用市场第二下载量最高的应用,仅次于语言学习平台Duolingo。⭐️中国教育科技企业在政策风险下成功开拓海外市场,Gauth和Question.AI受欢迎。⭐️Gauth利用人工智能技术提供各科目解题、在线专家支持等服务,获得用户青睐。站长网2024-04-18 21:55:520000