面壁智能推出最新一代端侧多模态模型 MiniCPM-Llama3-V2.5
站长网2024-05-21 01:30:123阅
面壁智能推出了最新一代端侧多模态模型 MiniCPM-Llama3-V2.5,这款模型具有超强的综合性能,能够超越 Gemini Pro 和 GPT-4V 等多模态巨无霸。
MiniCPM-Llama3-V2.5在 OCR(光学字符识别)方面取得了 SOTA 的成绩,能够精准识别难图、长图和长文本。该模型支持30多种语言,并且首次实现了端侧系统级多模态加速,使图像编码速度提升150倍。
此外,MiniCPM-Llama3-V2.5在幻觉能力、复杂推理能力等方面也取得了突出表现,能够在多种场景下进行准确的分析和推理。
总体来说,MiniCPM-Llama3-V2.5展现出了强大的多模态综合能力,为端侧 AI 模型的发展带来了新的突破。

MiniCPM-Llama3-V2.5开源地址:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM 系列开源地址:
https://github.com/OpenBMB/MiniCPM
Hugging Face 下载地址:
https://huggingface.co/openbmb/MiniCPM-Llama3-V-2_5
0003
评论列表
共(0)条相关推荐
清华抢先开源复刻版DragGAN 网友直呼PS不存在了!
还记得几天前发布的拖拽秒P图工具DragGAN吗?这个让网友直呼PS不存在了的工具,演示视频一经发布就在国内外火得一塌糊涂。这边官方版还没用上,港大、南大、清华等就抢先开源「复刻」版DragGAN。目前,这一功能已经被集成到InternGPT中。从官方放出的演示视频来看,基本可以达到DragGAN的效果,无论是改变表情,瘦脸还是脸部转动,InternGPT都可以轻松实现。站长网2023-05-26 12:13:370000大麦回应五月天门票被炒高价 采取实名制 以项目页面为准
5月26日至28日,中国台湾乐队五月天“2023好好好想见到你”演唱会将在北京鸟巢举行,“黄牛”哄抬价格等情况持续引发关注,有歌迷表示“抵制黄牛站着看演唱会”。站长网2023-05-15 15:46:150000马斯克、Grok与“数据封建主”
下周,马斯克踌躇已久的Grok就要上线了。在OpenAI接连甩出炸街新闻的这段时间,这事似乎没掀起太大波澜。然而,越低调的狙击,往往伤害越高。具体来说,Grok的这次年末突袭,隐藏了老马背刺OpenAI的一件“秘术”。所谓的“秘术”,其实也很简单,就是X平台上不断涌现的,真实的人类数据。在大模型数据愈发吃紧的今天,连OpenAI自己,也开始直接拿用户数据训练了。站长网2023-11-29 11:22:240000打好地基,小红书强绑SPU
前几天聚光平台上线了强绑定SPU,有同学觉得麻烦死了,为啥要强绑,不绑不能投?其实不仅聚光平台如此,蒲公英平台也有强绑情况出现,所以无论是不是喜欢,SPU必定是要贯穿在小红书生态里的一个功能,只能去接受它。但是,你可能想知道,小红书为啥要强绑SPU?SPU的意义是什么?今天我们来一起聊聊。01什么是SPU?0001图片质量媲美Midjourney、SDXL?PixArt训练成本减少90%
要点:PixArt-α是一款基于Transformer的文本到图像生成模型,具有竞争力的图像生成质量,且训练成本明显低于现有大规模文本到图像模型。PixArt-α采用了三项核心设计:训练策略分解,高效的T2ITransformer,以及使用高信息密度的数据进行训练,从而实现高分辨率图像合成,并在训练成本上取得显著节约。站长网2023-11-10 11:22:340004