面壁智能推出最新一代端侧多模态模型 MiniCPM-Llama3-V2.5
站长网2024-05-21 01:30:123阅
面壁智能推出了最新一代端侧多模态模型 MiniCPM-Llama3-V2.5,这款模型具有超强的综合性能,能够超越 Gemini Pro 和 GPT-4V 等多模态巨无霸。
MiniCPM-Llama3-V2.5在 OCR(光学字符识别)方面取得了 SOTA 的成绩,能够精准识别难图、长图和长文本。该模型支持30多种语言,并且首次实现了端侧系统级多模态加速,使图像编码速度提升150倍。
此外,MiniCPM-Llama3-V2.5在幻觉能力、复杂推理能力等方面也取得了突出表现,能够在多种场景下进行准确的分析和推理。
总体来说,MiniCPM-Llama3-V2.5展现出了强大的多模态综合能力,为端侧 AI 模型的发展带来了新的突破。
MiniCPM-Llama3-V2.5开源地址:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM 系列开源地址:
https://github.com/OpenBMB/MiniCPM
Hugging Face 下载地址:
https://huggingface.co/openbmb/MiniCPM-Llama3-V-2_5
0003
评论列表
共(0)条相关推荐
Magnific AI本周更新!可将图片放大至10K*10K分辨率
今天,MagnificAI创始人JaviLopez在推特宣布,MagnificAI将于本周更新,可将图片放大至10K*10K分辨率。有玩AI绘画的小伙伴们,对MagnificAI想必不会陌生。作为先进的AI图像放大和增强工具,它可以高清放大图像并根据用户提示重构细节。官网地址:https://top.aibase.com/tool/magnific-ai站长网2024-01-08 10:43:050003Sora来了,即梦可灵松了一口气
全网苦等10个月的Sora,终于亮相。北京时间12月10日凌晨,OpenAI直播第三弹,宣布旗下视频生成模型Sora正式面向大众推出。自今年2月首次预告以来,Sora仅向一些艺术家、知名演员和导演提供试用服务,但迟迟未上线,吊足大众胃口。此次一经发布,立即激发起全球网友的热情,挤爆服务器。0000最卷618,视频号还是没有大主播
一年一度的618开始了,视频号不能再佛系了,应该把握一年里最好的营销时机,冲击直播带货。在这个“最焦虑”的一届618,综合电商与短视频平台们使出浑身解数拥抱增长。根据易观研究数据显示,今年618第一周期(5月20日-6月3日),以淘宝天猫、京东、拼多多为首的综合电商大盘GMV增速达到了14%。不光是低价的功劳,直播电商在其中功不可没。站长网2024-06-12 16:02:470000华为HarmonyOS 4.0将于8月4日发布 或搭载AI大模型技术
华为宣布HarmonyOS4.0将于8月4日正式发布。此前,华为已经针对开发者公布了HarmonyOS4.0,以便于开发者提前进行适配,也因此被曝光出了一些新系统的特性。HarmonyOS4.0的流畅性将更进一步,UI动画也将更加丝滑,系统反应速度显著提升。据开发者透露,HarmonyOS4.0或将会新增LTPO自适应无极刷新率,支持1-120Hz自如调节,让屏幕流畅性和省电兼得。站长网2023-07-26 11:20:480000麻省理工学院的新人工智能模型检测胰腺癌的早期迹象
麻省理工学院(MITCSAIL)的人工智能实验室与哈佛大学放射肿瘤学系的LimorApelbaum博士合作,提出了两种新的人工智能模型,称为PRISM神经网络(PrismNN)和逻辑回归(PrismLR),用于早期检测胰腺导管腺癌(PDAC),这是一种致命的癌症。图源备注:图片由AI生成,图片授权服务商Midjourney发现的重要性站长网2024-01-19 15:42:320000