开源多模态LLM InternVL 1.5:具备OCR能力 可解读4K图片
划重点:
⭐️ InternVL 家族是一个开源套件,为商用多模态模型提供了可行的开源替代方案
⭐️ InternVL-Chat-V1.5发布,接近 GPT-4V 和 Gemini Pro 在各种基准测试上的性能
⭐️ InternVL 的模型可用于视觉感知、跨模态检索等多个领域,实现了多项技术突破
站长之家(ChinaZ.com) 4月29日 消息:InternVL 家族的开源套件提供了一种商用多模态模型的可行开源替代方案。其中,最新发布的 InternVL-Chat-V1.5模型在多个基准测试上取得了接近 GPT-4V 和 Gemini Pro 的性能,这使得 InternVL 家族成为了当前最接近 GPT-4V 表现的可商用开源模型之一。

InternVL 家族的模型涵盖了多个领域,包括视觉感知和跨模态检索。其在视觉感知方面,利用 ViT-22B 模型在 ImageNet-1K、ImageNet-Real、ImageNet-V2等数据集上取得了优异表现,展现出强大的图像分类能力。另外,InternVL 家族还在语义分割、零样本图像分类等任务上取得了显著进展,为多模态模型的发展贡献了重要的技术突破。

作为一款人工智能产品,InternVL 家族的亮点在于其开源套件的多模态模型,尤其是最新发布的 InternVL-Chat-V1.5。该模型不仅在性能上接近商用顶尖模型,而且还具备强大的多模态对话能力,并且支持中文,拥有较强的 OCR 能力。
除此之外,InternVL 家族的模型还具备动态分辨率的支持,为用户提供更加灵活的使用体验。InternVL 家族的开源套件为多模态模型领域的发展注入了新的活力。
产品入口:https://top.aibase.com/tool/internvl
体验网址:https://huggingface.co/spaces/OpenGVLab/InternVL
联名兰博基尼!Redmi K70 Pro冠军版明晚开售
站长之家(ChinaZ.com)12月20日消息:RedmiK70Pro冠军版将于明晚7点直播开售。官方还透露,将有一位神秘嘉宾到场,进行一场硬核手机开箱的跨界挑战。值得注意的是,小米集团卢伟冰曾在发布会上透露,RedmiK70Pro冠军版是限量机型,喜欢这款产品的朋友千万不要错过明晚的抢购机会。0000微软应用商店用上AI:上千条用户评价一句话看完
快科技7月25日消息,作为OpenAI背后最大的股东之一,微软毫不吝啬在自家的应用上加入AI作为辅助。现在,微软开始尝试在应用商店中,加入AI相关功能。目前,美国地区的微软应用商店已经支持通过AI,在几秒钟内将一个应用的数千条在线评论总结成一段精炼的文字,突出显示最重要的观点。对于用户来说,这将大大提升选择与下载应用时,收集参考建议的效率。0000比尔·盖茨预测人工智能将引发技术爆炸
**划重点:**1.🌐"人工智能将以前所未见的速度加速新发现"—盖茨在年度展望信说道。2.💡在未来18至24个月内,盖茨预测美国等发达国家普通民众将开始广泛使用人工智能,对生产力和创新产生巨大影响。3.🌍盖茨重点关注人工智能在发展中国家的应用,特别强调在全球卫生领域的平等性。0000闯入美榜Top100,昔日网文王者的短剧APP终于还是杀出来了?
不久前,一款名为DreameShort的产品闯入美国iOS畅销总榜Top100,刷新近30天在美榜的最高排名。6月20日,DreameShort来到美国iOS畅销总榜Top100站长网2024-07-04 09:21:130000德国将对OpenAI的ChatGPT数据使用情况展开调查
继意大利,德国数据保护机构现在也正在加强对ChatGPT的监管,德国联邦州数据保护专员们同启动了相应的行政程序。德国AI工作组负责人迪特·库格尔曼表示,“如果使用个人数据,包括作为AI的训练数据,必须有法律依据,我们必须知道数据来自何处。”站长网2023-04-21 11:55:540000