Hugging Face 推出开源多模态 AI 模型 IDEFIX
站长网2023-08-24 11:44:080阅
人工智能创业公司 Hugging Face 最近推出了一款名为 IDEFIX 的开源多模态 AI 模型。IDEFIX 可以处理图像和文本输入,并生成连贯的文本输出。
IDEFIX 基于视觉语言模型 Flamingo 构建,Flamingo 是去年由 DeepMind 开发的一款领先的多模态 AI 模型。IDEFIX 使用了包括维基百科、公共多模态数据集和 LAION 在内的各种开放数据集进行了训练。此外,Hugging Face 还引入了一个新的多模态数据集 OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。
与专有模型相比,IDEFIX 在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。这标志着多模态 AI 开源模型的一个重要进步。
相比之下,OpenAI 的 ChatGPT 目前还不支持处理图像。GPT-4尽管宣称具有多模态功能,但其图像处理能力还非常有限。
除了 IDEFICS 之外,目前 Bard 和 Bing 还接受图像作为输入并创建文本。
您可以在这里尝试 IDEFICS:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
0000
评论列表
共(0)条相关推荐
什么样的自媒体更赚钱?
站长网2023-07-14 20:07:480000SAM模型加速变体EdgeSAM 比原始SAM提速40倍
EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。该方法将原始的基于ViT的SAM图像编码器提炼成纯CNN架构,更适合边缘设备。通过仔细评估各种提炼策略,研究人员证明了任务不可知的编码器提炼无法捕捉SAM所蕴含的全部知识。站长网2023-12-14 12:10:340003微信:9月1日起 微信小程序须完成备案后才可上架
站长网2023-08-10 10:17:080000「短」内容为王的时代来了,这会是写手们最好的时代么?
下面是一个短视频的脚本:单读这段脚本文字,可谓是索然无味的典范,甚至不通顺到懒得读完。但因为是在短视频场景下,30秒达人就完成了痛点引入、需求描述和产品的宣传。并且收获了187万点赞。再看下面这几张截图里的文案这是今天主流美妆、消费品牌在社群内的产品营销文案。一样的情况,如果你仔细去阅读文案的内容,会很痛苦;但如果只是扫一眼反倒能知道他们在说什么。站长网2023-07-31 17:44:110000由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司EssentialAI已从隐秘状态中浮现,获得了5650万美元的新融资。站长网2023-12-13 10:46:000000