Hugging Face 推出开源多模态 AI 模型 IDEFIX
站长网2023-08-24 11:44:080阅
人工智能创业公司 Hugging Face 最近推出了一款名为 IDEFIX 的开源多模态 AI 模型。IDEFIX 可以处理图像和文本输入,并生成连贯的文本输出。
IDEFIX 基于视觉语言模型 Flamingo 构建,Flamingo 是去年由 DeepMind 开发的一款领先的多模态 AI 模型。IDEFIX 使用了包括维基百科、公共多模态数据集和 LAION 在内的各种开放数据集进行了训练。此外,Hugging Face 还引入了一个新的多模态数据集 OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。

与专有模型相比,IDEFIX 在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。这标志着多模态 AI 开源模型的一个重要进步。
相比之下,OpenAI 的 ChatGPT 目前还不支持处理图像。GPT-4尽管宣称具有多模态功能,但其图像处理能力还非常有限。
除了 IDEFICS 之外,目前 Bard 和 Bing 还接受图像作为输入并创建文本。
您可以在这里尝试 IDEFICS:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
0000
评论列表
共(0)条相关推荐
大模型「冲向」三四线城市年轻人
去年11月末ChatGPT的上线,引燃了全球大模型、AIGC等与AI领域相关的混战。在过去的两百多天里,上至互联网大厂,下至普通用户,纷纷涉足大模型,企图抓住这一科技发展的最新风口,实现“逆风翻盘”。大厂的大模型焦虑也蔓延至普通用户,他们一方面开始试着学习AI大模型,另一方面也在生活工作中利用AI。站长网2023-08-28 15:42:490001月流水稳至500万-700万:高客单日料店的全域新策略
当下餐饮门店经常会面临一个问题:流量来了后没办法有效承接。这也是很多线下餐饮门店加入到私域运营阵地的主要原因之一。同时随着私域的发展,更多品牌开始强调公私域联动的效应,这使很多门店不得不开始加快转型脚步,高端日料店「竹哩」就是其中之一。站长网2023-11-17 13:56:530000萝卜快跑回应一家4口乘车提示超载:暂不符合目前行驶需求
快科技7月14日消息,近期,百度Apollo旗下的萝卜快跑”无人驾驶出租车,引起网友关注热议,不少网友借机体验一番。不过,一些乘客并不清楚无人车的搭乘规定,从而导致无人车拒载,影响了使用体验。据国内媒体报道,7月11日,湖北武汉,一女子发视频称其一家四口体验萝卜快跑,但上车后发现副驾不能乘坐,后排乘坐被提示超载,无奈只能下车取消订单。0000英伟达市值反超苹果 首次突破3万亿美元
在全球科技巨头的竞争中,英伟达凭借卓越的业绩表现和强劲的市场势头,市值首次突破3万亿美元,成功超越苹果,紧随微软之后,位列全球市值第二高的公司。这一历史性的里程碑是在今日凌晨达成的,英伟达股价大涨5%,刷新了历史新高。收盘时,英伟达股价上涨5.16%,达到每股1224.4美元,市值稳稳地站在了3.01万亿美元的高地上。这使得英伟达成为继微软和苹果之后,第三家市值超过3万亿美元的公司。站长网2024-06-06 14:11:050000字节AI,“软硬”兼施
属于AI的投资热潮仍在继续,只不过资本的注意力开始由“软”变“硬”。无数海外初创公司前仆后继下,今年8月中旬,国内掀起了一阵围绕AI智能眼镜的投资热潮。大模型为可穿戴硬件“注入灵魂”的想象力,快速在全球范围内形成共识。0000