Hugging Face 推出开源多模态 AI 模型 IDEFIX
站长网2023-08-24 11:44:080阅
人工智能创业公司 Hugging Face 最近推出了一款名为 IDEFIX 的开源多模态 AI 模型。IDEFIX 可以处理图像和文本输入,并生成连贯的文本输出。
IDEFIX 基于视觉语言模型 Flamingo 构建,Flamingo 是去年由 DeepMind 开发的一款领先的多模态 AI 模型。IDEFIX 使用了包括维基百科、公共多模态数据集和 LAION 在内的各种开放数据集进行了训练。此外,Hugging Face 还引入了一个新的多模态数据集 OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。

与专有模型相比,IDEFIX 在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。这标志着多模态 AI 开源模型的一个重要进步。
相比之下,OpenAI 的 ChatGPT 目前还不支持处理图像。GPT-4尽管宣称具有多模态功能,但其图像处理能力还非常有限。
除了 IDEFICS 之外,目前 Bard 和 Bing 还接受图像作为输入并创建文本。
您可以在这里尝试 IDEFICS:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
0000
评论列表
共(0)条相关推荐
每月6元!用户被中国移动多收8年来电显示费上热搜:官方回应了
快科技7月15日消息,据国内媒体报道称,有用户反馈称,自己的父母被中国移动多收8年来电显示费,每月6元累计费用无法退回。报道中提到,这位用户如果不给父母查询手机账单时意外发现,老人至今每月都被收取6元的来电显示”增值业务费。随后这个话题迅速登上了热搜,有不少网友纷纷表示,自己也不知道来电显示费已取消,每月仍被扣除6元费用。0000医疗大模型Med-PaLM M:可灵活地编码和解释生物医学数据
由谷歌旗下多家研究所组成的专家团队近日发布论文,公布了一款名为Med-PaLMM的多模态模型。Med-PaLMM是一个大型多模态生成模型,可以灵活地编码和解释生物医学数据。Med-PaLMM相比于现有模型在多项任务上表现竞争力,甚至有些任务表现更好。论文地址:https://arxiv.org/abs/2307.14334站长网2023-07-31 11:50:460000鸿海规划新增五到六条生产线来迎合 AI 服务器客户的强劲需求
鸿海集团旗下的鸿百科技在备货iPhone15新机时,其AI服务器相关业务需求同步强劲。为此,鸿海集团规划新增五到六条生产线来迎合AI服务器客户的要求。站长网2023-06-13 14:07:560000AI在线PPT生成工具——AiPPT:输入主题即可一键生成高质量PPT
AiPPT是一款基于人工智能和自然语言处理技术的在线PPT生成工具,用户只需输入主题即可一键生成高质量PPT。该工具支持多种文档格式上传生成,内置上千套定制级模板,支持自由灵活的编辑能力。用户可以随意调整PPT幻灯片的页面、形状、字体、颜色、大小等细节,都能自由编辑。体验地址:https://www.aippt.cn/站长网2023-09-04 14:28:370000