开源多模态LLM InternVL 1.5:具备OCR能力 可解读4K图片
划重点:
⭐️ InternVL 家族是一个开源套件,为商用多模态模型提供了可行的开源替代方案
⭐️ InternVL-Chat-V1.5发布,接近 GPT-4V 和 Gemini Pro 在各种基准测试上的性能
⭐️ InternVL 的模型可用于视觉感知、跨模态检索等多个领域,实现了多项技术突破
站长之家(ChinaZ.com) 4月29日 消息:InternVL 家族的开源套件提供了一种商用多模态模型的可行开源替代方案。其中,最新发布的 InternVL-Chat-V1.5模型在多个基准测试上取得了接近 GPT-4V 和 Gemini Pro 的性能,这使得 InternVL 家族成为了当前最接近 GPT-4V 表现的可商用开源模型之一。

InternVL 家族的模型涵盖了多个领域,包括视觉感知和跨模态检索。其在视觉感知方面,利用 ViT-22B 模型在 ImageNet-1K、ImageNet-Real、ImageNet-V2等数据集上取得了优异表现,展现出强大的图像分类能力。另外,InternVL 家族还在语义分割、零样本图像分类等任务上取得了显著进展,为多模态模型的发展贡献了重要的技术突破。

作为一款人工智能产品,InternVL 家族的亮点在于其开源套件的多模态模型,尤其是最新发布的 InternVL-Chat-V1.5。该模型不仅在性能上接近商用顶尖模型,而且还具备强大的多模态对话能力,并且支持中文,拥有较强的 OCR 能力。
除此之外,InternVL 家族的模型还具备动态分辨率的支持,为用户提供更加灵活的使用体验。InternVL 家族的开源套件为多模态模型领域的发展注入了新的活力。
产品入口:https://top.aibase.com/tool/internvl
体验网址:https://huggingface.co/spaces/OpenGVLab/InternVL
Adobe 称印度是其增长最快的市场之一
划重点:-🚀Adobe在印度市场取得了快速增长,助力各行业企业采用数字化解决方案。-💻Adobe计划在印度推出数据中心基础设施,以满足当地数据法规和提高性能。-🎨Adobe致力于负责任地使用生成式AI,保护知识产权并与其他机构合作。AdobeIndia是Adobe公司的第二大部门,如今拥有超过8000名员工,从1997年的单一开发中心发展成为全球企业。站长网2024-05-22 15:13:06000015小时、几千元训完中文版LLaMA2!低成本方案全面开源,包含代码权重,支持商用
训练大模型,几千块就能实现了!现在,15小时、几千块钱、85亿token数据,即可训出中文LLaMA2。综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源,包括全套训练流程、代码及权重。而且无商业限制,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。要知道,从头预训练大模型此前被戏称“要5000万美元才能入局”,让许多开发者和中小企业都望而却步。站长网2023-09-25 14:12:250000AI日报:新壹视频大模型2.0发布;LivePortrait支持用图片控制动画;AI腹肌软件Gigabody爆火;免费无水印的AI视频生成工具Hotshot
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、新壹视频大模型2.0发布:支持1080P60帧输出最高支持4K站长网2024-08-21 15:55:160000媲美激光雷达!百度发布纯视觉高阶智驾ANP3 Pro:全国都能开
快科技4月23日消息,百度Apollo昨日举办智能汽车产品发布会,围绕汽车智能化,发布了全新升级的驾舱图”系列产品。会上,百度Apollo正式发布了纯视觉城市领航辅助驾驶产品ANP3Pro,将高阶城市智驾的硬件成本拉入万元时代。而且ANP3Pro可支持15-25万元价格区间的新能源车型搭载,将加速高阶智驾走向大众市场”。站长网2024-04-23 14:45:360000极越CEO夏一平:公司没有倒闭 股东承担员工离职赔偿
快科技12月12日消息,日前,极越汽车经营遇困难,员工自费上班”社保不再交付”公司倒闭”等话题在网络引发关注。据媒体报道,对于社保问题,极越CEO夏一平在内部会议中表示,目前公司账户已经被冻结了,自己并不是企业第一责任人,但将会尽力在明天凌晨一点前解决北京员工的社保问题,上海员工社保缴纳问题将在27日前解决,具体如何操作还需要与董事会进行讨论。0000