Hugging Face 推出开源多模态 AI 模型 IDEFIX
站长网2023-08-24 11:44:080阅
人工智能创业公司 Hugging Face 最近推出了一款名为 IDEFIX 的开源多模态 AI 模型。IDEFIX 可以处理图像和文本输入,并生成连贯的文本输出。
IDEFIX 基于视觉语言模型 Flamingo 构建,Flamingo 是去年由 DeepMind 开发的一款领先的多模态 AI 模型。IDEFIX 使用了包括维基百科、公共多模态数据集和 LAION 在内的各种开放数据集进行了训练。此外,Hugging Face 还引入了一个新的多模态数据集 OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。
与专有模型相比,IDEFIX 在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。这标志着多模态 AI 开源模型的一个重要进步。
相比之下,OpenAI 的 ChatGPT 目前还不支持处理图像。GPT-4尽管宣称具有多模态功能,但其图像处理能力还非常有限。
除了 IDEFICS 之外,目前 Bard 和 Bing 还接受图像作为输入并创建文本。
您可以在这里尝试 IDEFICS:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
0000
评论列表
共(0)条相关推荐
iPhoneSE4或将使用iPhone14同款电池 以降低生产成本
据MacRumors报道,iPhoneSE4将使用与iPhone14相同的电池,以降低生产成本。有消息称,一些原型机已经配备了型号为A2863的锂离子电池,这与iPhone14使用的电池完全相同。内部设计文件也证实了这一变化。0000免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频
🔍划重点:1.VideoCrafter是一款新的开源视频创建和编辑套件,利用扩散模型从文本描述生成照片和视频逼真的输出。2.无需视频编辑或动画经验,任何人都可以轻松制作专业品质的视频。3.VideoCrafter提供用户友好的界面,是免费的开源项目,可以用于制作解释性动画、产品展示、教育视频、宣传片等。站长网2023-10-25 00:13:2200019技术融合:Automattic将Tumblr博客转战WordPress平台
Automattic公司周三宣布了一项重大决策,将把旗下Tumblr平台的全部5亿个博客迁移至基于WordPress的新后端系统。作为WordPress.com和Tumblr的母公司,Automattic此举意在整合两大平台的技术优势,为用户带来更稳定、功能更丰富的博客体验。站长网2024-08-31 16:11:200000骗子用AI语音克隆拜登声音进行电话诈骗 被罚600万美元
划重点:⭐FCC提出对电话骗子罚款600万美元,后者利用声音克隆技术冒充拜登总统进行非法电话骚扰。⭐FCC强调警告其他潜在高科技诈骗者,要求遵守电话骚扰法规,尤其是使用生成式人工智能技术。⭐骗子利用声音克隆技术在新罕布什尔州初选期间冒充总统拜登进行电话骚扰,涉案者应对多项违规行为接受指控。站长网2024-05-24 18:28:450000OpenAI更新GPT商店,增加用户评分和扩展构建者资料
**划重点:**1.🌟用户现在可以为第三方GPT在GPT商店中进行评分,并提供私人反馈。2.🤖GPT构建者的个人资料现在更丰富,包括链接到LinkedIn页面、X账户和网站,以及平均评分和总评分数量等信息。3.💰尽管商店不断扩展功能,但OpenAI与GPT创作者分享收益的设想仍未实现。站长网2024-02-23 10:41:090000