智源悟道3.0“Emu”模型开源
站长网2023-07-14 16:31:070阅
智源研究院发布了首个全能多模态预训练模型 Emu 的开源版本。Emu 在多项性能指标上超越了 DeepMind 的 Flamingo 模型,具备统一多模态学习框架和视频数据的大量采用的能力。
Emu 可以完成任意图生文和文生图的多模态任务,包括图像描述、图像问答、视频问答、文图生成、图像融合和多模态对话等。Emu 还具有强大的少样本上下文学习能力,可以根据给定任务的几个示例样本进行上下文学习。
Emu 在8个基准测试中展现出极强的零样本性能,具有强大的泛化能力。模型还具有世界知识丰富、视频理解能力强、图像融合和上下文图像生成等技术亮点。
Emu 首次大量采用视频数据,并创新性建立了统一多模态学习框架,将不同来源的多模态交错数据进行自回归建模,同时首次采用了海量视频作为图文交错序列数据。
模型训练方面,Emu 使用自回归方式预测多模态序列中的下一个元素作为统一的学习目标。总之,Emu 是一款功能强大的全能多模态预训练模型,具备广泛的应用前景。
论文链接:
https://arxiv.org/pdf/2307.05222.pdf
模型链接:
https://github.com/baaivision/Emu
Demo链接:
https://emu.ssi.plus/
0000
评论列表
共(0)条相关推荐
m峰会:电商AI大模型上线,阿里妈妈百灵&万相台无界版发布!
随着移动互联网的浸润,用户消费行为发生改变,传统的经营经验逐渐显得乏力。为了给生意多创造出一份确定性,越来越多的经营者开始尝试更多的经营新机会,但是机会的增多也在加剧经营环境的复杂性。一方面,用户活动的场域正在经历多样化的变革,商家需要对获客策略进行相应地重构;另一方面,内容在消费决策中的权重上升,以及经营全流程的数字化,都对商家的经营能力提出新的要求。站长网2023-09-07 09:17:030000骁龙8 Gen3最新曝光:3nm/4nm双版本 性能大幅提升50%
快科技9月26日消息,高通此前已经宣布2023年Snapdragon峰会将于10月24日至26日举行,预计到时候将会发布大家期待已久的全新一代骁龙8Gen3芯片。站长网2023-09-26 17:20:400000查理·芒格的最后一次重大判断可能是正确的:人工智能被过度炒作
查理·芒格,伯克希尔·哈撒韦公司的传奇投资者,于当地时间周二99岁高龄去世。他与投资伙伴沃伦·巴菲特一起投资苹果、好市多和可口可乐的决策,巩固了他作为传奇投资者的声誉,并推动伯克希尔·哈撒韦的现金储备攀升至创纪录的1570亿美元。站长网2023-11-30 11:49:380001我向这位CTO提了三个AIGC问题
ChatGPT的爆火、AIGC新技术的出现,正在掀起一场全新的行业变革大浪潮,它对未来商业的变革、对未来岗位和职业的影响将更为广泛和深刻。见实前不久发起主题为《AIGC冲击、变化和想象》的新白皮书撰写。本文便是来自撰写过程中的一次深度对话,电话的另一端是行业某头部广告营销公司CTO许楠,深聊中,许楠指出了AIGC对个人、企业以及行业的冲击与影响,并回答了三个AIGC常见问题:0000苹果已与OpenAI正式达成协议 iOS18将用上ChatGPT
站长之家(ChinaZ.com)5月27日消息:近日,彭博社记者马克・古尔曼(MarkGurman)透露,苹果公司已经与OpenAI达成了一项重要协议,计划为即将发布的iOS18系统带来一系列前沿的生成式AI功能。这不仅标志着苹果在人工智能领域的又一重大突破,也预示着iOS系统将迎来前所未有的智能化升级。站长网2024-05-27 19:35:550000