面壁智能推出最新一代端侧多模态模型 MiniCPM-Llama3-V2.5
站长网2024-05-21 01:30:122阅
面壁智能推出了最新一代端侧多模态模型 MiniCPM-Llama3-V2.5,这款模型具有超强的综合性能,能够超越 Gemini Pro 和 GPT-4V 等多模态巨无霸。
MiniCPM-Llama3-V2.5在 OCR(光学字符识别)方面取得了 SOTA 的成绩,能够精准识别难图、长图和长文本。该模型支持30多种语言,并且首次实现了端侧系统级多模态加速,使图像编码速度提升150倍。
此外,MiniCPM-Llama3-V2.5在幻觉能力、复杂推理能力等方面也取得了突出表现,能够在多种场景下进行准确的分析和推理。
总体来说,MiniCPM-Llama3-V2.5展现出了强大的多模态综合能力,为端侧 AI 模型的发展带来了新的突破。
MiniCPM-Llama3-V2.5开源地址:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM 系列开源地址:
https://github.com/OpenBMB/MiniCPM
Hugging Face 下载地址:
https://huggingface.co/openbmb/MiniCPM-Llama3-V-2_5
0002
评论列表
共(0)条相关推荐
Hugging Face发布新开源编程大语言模型StarCoder :可自动写代码、根据指令改代码
企业工作流公司ServiceNow和ML工具开发商HuggingFace开发了一种用于编码的开源大型语言生成AI模型——StarCoderLLM。站长网2023-05-09 12:09:090005优酷换logo了!采用蓝橙配色方案
站长之家(ChinaZ.com)1月16日消息:线视频平台优酷近日对其Logo进行了更新。与之前大家熟悉的“红蓝”配色不同,新Logo采用了“蓝橙”主题色。这次改动也引起了广大网友和业界的关注。值得注意的是,这并不是优酷首次对其Logo进行更新。站长网2024-01-16 16:17:010000推特在苹果商店更名为X 或为首家单字符批准
根据报道,Twitter应用在苹果AppStore上已经更名为X,这可能是因为该公司获得了苹果的特批。产品设计师NickSheriff此前在Twitter上表示,在iOS上苹果不允许任何应用使用单个字符作为命名。获得苹果的特批也说明了Twitter在品牌知名度和用户影响力方面具有很强的优势。此外,改名也是为了更好地满足用户需求和提升品牌形象。站长网2023-07-31 14:28:520001理想汽车:首销期全新L6单日定单破万、累计定单已超4.1万台
五一假期的热潮刚刚退去,理想汽车便交出了一份亮眼的成绩单。据官方最新公布的数据,自4月18日开启预售至5月5日首销期结束,全新理想L6的累计定单已突破惊人的41000台大关。特别值得一提的是,在5月5日首销权益的最后一天,理想L6单日定单数量便高达1万台,这一表现无疑显示了市场对这款车型的热烈追捧。站长网2024-05-06 18:06:290000AI开源项目screenshot-to-code 借助GPT-4V直接把网页截图制作成HTML网页
这是一个简单的应用程序,可将截图转换为HTML/TailwindCSS。它利用GPT-4Vision生成代码,并使用DALL-E3生成类似的图像。用户只需上传截图,即可获得整洁的前端代码,包括HTML、TailwindCSS和JavaScript。项目地址:https://github.com/abi/screenshot-to-code主要功能:站长网2023-11-17 11:43:510002