智源悟道3.0“Emu”模型开源
站长网2023-07-14 16:31:070阅
智源研究院发布了首个全能多模态预训练模型 Emu 的开源版本。Emu 在多项性能指标上超越了 DeepMind 的 Flamingo 模型,具备统一多模态学习框架和视频数据的大量采用的能力。
Emu 可以完成任意图生文和文生图的多模态任务,包括图像描述、图像问答、视频问答、文图生成、图像融合和多模态对话等。Emu 还具有强大的少样本上下文学习能力,可以根据给定任务的几个示例样本进行上下文学习。
Emu 在8个基准测试中展现出极强的零样本性能,具有强大的泛化能力。模型还具有世界知识丰富、视频理解能力强、图像融合和上下文图像生成等技术亮点。
Emu 首次大量采用视频数据,并创新性建立了统一多模态学习框架,将不同来源的多模态交错数据进行自回归建模,同时首次采用了海量视频作为图文交错序列数据。
模型训练方面,Emu 使用自回归方式预测多模态序列中的下一个元素作为统一的学习目标。总之,Emu 是一款功能强大的全能多模态预训练模型,具备广泛的应用前景。
论文链接:
https://arxiv.org/pdf/2307.05222.pdf
模型链接:
https://github.com/baaivision/Emu
Demo链接:
https://emu.ssi.plus/
0000
评论列表
共(0)条相关推荐
亚马逊机器学习团队推出 Mistral 7B 基础模型 支持8000个token上下文长度
文章概要:-Mistral7B是MistralAI开发的英文文本和代码生成基础模型,参数规模70亿。-SageMakerJumpStart提供一键部署Mistral7B进行推理,可快速自定义。-Mistral7B具有8000个token的上下文长度,表现低延迟和高吞吐量。站长网2023-10-10 10:06:040000OpenAI 与 Upwork 合作帮助企业招聘人工智能专家
站长之家(ChinaZ.com)8月1日消息:希望聘请在OpenAI技术中熟悉的人工智能(AI)专家的企业,可以利用OpenAI和Upwork之间的新合作伙伴关系来寻找员工。站长网2023-08-01 09:53:300000苹果AI哪去了?前员工揭秘Siri何以走向没落:团队内耗、技术判断太谨慎
苹果为何会在最新一轮ChatGPT趋势中“静悄悄”?答案更进一步浮出水面。内部团队混乱、决策缓慢、代码笨重,都成为了拖累苹果AI更快前进的原因。最直接的体现,可以来看Siri。这大概是大部分普通人认识AI助手的入口,是iPhone鼎盛时期推出的王炸功能;许多人理解ChatGPT时,也不免拿它来做参照。但在比对后就会发现,如今的Siri在智能化上,完全无法和ChatGPT相提并论。站长网2023-05-12 20:40:360002Claude也变懒了!网友:学会给自己放假了
开学将至,该收心的不止有即将开启新学期的同学,可能还有AI大模型。前段时间,Reddit上挤满了吐槽Claude越来越懒的网友。「它的水平下降了很多,经常停顿,甚至输出也变得很短。在发布的第一周,它可以一次性翻译整整4页文稿,现在连半页都输出不了了!」站长网2024-09-02 16:23:340000猿辅导成立小猿智能科技公司
天眼查App显示,近日,北京小猿智能科技有限公司成立,法定代表人为王向东,注册资本100万人民币,经营范围含计算机系统服务、计算机软硬件及辅助设备批发、计算机软硬件及辅助设备零售、电子产品销售、通讯设备销售等,由猿辅导教育科技香港有限公司全资持股。5月30日,猿辅导宣布推出全新智能硬件产品——小猿学练机,具备AI练习批改功能。站长网2023-06-16 16:32:280000