开源多模态LLM InternVL 1.5:具备OCR能力 可解读4K图片
划重点:
⭐️ InternVL 家族是一个开源套件,为商用多模态模型提供了可行的开源替代方案
⭐️ InternVL-Chat-V1.5发布,接近 GPT-4V 和 Gemini Pro 在各种基准测试上的性能
⭐️ InternVL 的模型可用于视觉感知、跨模态检索等多个领域,实现了多项技术突破
站长之家(ChinaZ.com) 4月29日 消息:InternVL 家族的开源套件提供了一种商用多模态模型的可行开源替代方案。其中,最新发布的 InternVL-Chat-V1.5模型在多个基准测试上取得了接近 GPT-4V 和 Gemini Pro 的性能,这使得 InternVL 家族成为了当前最接近 GPT-4V 表现的可商用开源模型之一。
InternVL 家族的模型涵盖了多个领域,包括视觉感知和跨模态检索。其在视觉感知方面,利用 ViT-22B 模型在 ImageNet-1K、ImageNet-Real、ImageNet-V2等数据集上取得了优异表现,展现出强大的图像分类能力。另外,InternVL 家族还在语义分割、零样本图像分类等任务上取得了显著进展,为多模态模型的发展贡献了重要的技术突破。
作为一款人工智能产品,InternVL 家族的亮点在于其开源套件的多模态模型,尤其是最新发布的 InternVL-Chat-V1.5。该模型不仅在性能上接近商用顶尖模型,而且还具备强大的多模态对话能力,并且支持中文,拥有较强的 OCR 能力。
除此之外,InternVL 家族的模型还具备动态分辨率的支持,为用户提供更加灵活的使用体验。InternVL 家族的开源套件为多模态模型领域的发展注入了新的活力。
产品入口:https://top.aibase.com/tool/internvl
体验网址:https://huggingface.co/spaces/OpenGVLab/InternVL
OpenAssistant发布其开源ChatGPT竞争对手
在OpenAI发布之后ChatGPT,去年12月份开源项目OpenAssistant也发布了其第一个模型、训练数据和代码,功能类似于OpenAI的ChatGPT。为什么重要:人工智能研究的民主化,特别是在大规模语言模型及其对齐领域,仅限于少数具有训练和收集数据资源的研究实验室。OpenAssistant发布模型和数据旨在使这项研究民主化,并提供包容性和多样化的研究工作。站长网2023-04-17 09:58:220001Anim400K:一个针对视频自动配音设计的数据集
Anim400K:一个针对视频自动配音设计的数据集,包含超过425,000个对齐的音视频剪辑,总时长达763小时。这些剪辑来自超过190个作品,涵盖了数百种主题和类型,并包含英语和日语两种语言的内容。利用这个数据集,开发者可以训练和改进自动配音系统,同时支持多种视频相关任务,如同步翻译、引导式视频概括和类型/主题/风格分类。站长网2024-01-16 14:31:380002特斯拉推送OTA升级 3大改变 车主狂喷:太傲慢 龟速进化
快科技8月5日消息,近日特斯拉推送了【2023.20.9】OTA软件版本升级。本次推送有三大更新:1、优化了拼音键盘功能2、大号文本适用所有支持的语言3、可以查看自上次维修以来的行驶里程数对此,不少车主表示毫无诚意:-这更新鸡肋中的鸡肋。雨刷问题、地图问题真就不管了?-龟速进化-我能去你们软件部上班吗?我最擅长摸鱼了有车主还指出了特斯拉当前存在的严重问题,包括:站长网2023-08-05 14:18:360000“妙鸭相机”推出支付宝小程序
近日,火爆出圈的AI应用“妙鸭相机”正式推出了支付宝小程序版本。从7月17日正式上线以来,“妙鸭相机”就以9块9获得高质量写真照引发了网友大量关注,高峰期一度有4000-5000人排队。目前,其支付宝小程序刚上线就吸引了超6万用户访问。同时,妙鸭还在支付宝上开通了生活号。站长网2023-08-11 12:40:050000意大利数据保护监管机构指责OpenAI违反GDPR规定
**划重点:**1.🕵️意大利数据保护机构正式起诉OpenAI,指称其ChatGPT违反GDPR规定。2.💻调查源于去年,指责ChatGPT在大规模处理意大利人个人信息时违反了GDPR规则。3.🌐OpenAI可能面临高达2千万欧元或全球年收入的4%的罚款,同时未获得数百万欧洲公民的同意处理其个人数据。站长网2024-01-30 10:09:310000