智谱开源新一代多模态大模型CogVLM2

站长网2024-05-21 11:29:251阅

智谱·AI最近宣布推出新一代多模态大模型CogVLM2，该模型在关键性能指标上相较于前一代CogVLM有了显著提升，同时支持8K文本长度和高达1344*1344分辨率的图像。CogVLM2在OCRbench基准上性能提升了32%，在TextVQA基准上性能提升了21.9%，显示出强大的文档图像理解能力。尽管CogVLM2的模型大小为19B，但其性能接近或超过了GPT-4V的水平。

CogVLM2的技术架构在上一代模型的基础上进行了优化，包括一个50亿参数的视觉编码器和一个70亿参数的视觉专家模块，这些模块通过独特的参数设置，精细地建模了视觉与语言序列的交互。这种深度融合策略使得视觉模态与语言模态能够更加紧密地结合，同时保持了模型在语言处理上的优势。此外，CogVLM2在推理时实际激活的参数量仅约120亿，这得益于其精心设计的多专家模块结构，显著提高了推理效率。

在模型效果方面，CogVLM2在多个多模态基准测试中取得了优异的成绩，包括TextVQA、DocVQA、ChartQA、OCRbench、MMMU、MMVet和MMBench等。这些测试涵盖了从文本和图像理解到复杂推理和跨学科任务的广泛能力。CogVLM2的两个模型在多个基准中取得了最先进的性能，同时在其他性能上也能达到与闭源模型相近的水平。

代码仓库:

Github:https://github.com/THUDM/CogVLM2

模型下载:

Huggingface:huggingface.co/THUDM

魔搭社区:modelscope.cn/models/ZhipuAI

始智社区:wisemodel.cn/models/ZhipuAI

Demo体验:

https://modelscope.cn/studios/ZhipuAI/Cogvlm2-llama3-chinese-chat-Demo/summary

CogVLM2技术文档:

https://zhipu-ai.feishu.cn/wiki/OQJ9wk5dYiqk93kp3SKcBGDPnGf

智谱开源新一代多模态大模型CogVLM2

0001

评论列表

共(0)条

相关推荐

站长资讯
卷到最后，卷的都是这个
见实有着国内顶尖私域操盘手会员群，每天都与大量的私域高手交流，也沉淀了很多行之有效的方法论。但是最近见实发现，似乎大家越卷越卷不动了，卷到最后，大家只能卷一个东西——内容。私域运营的核心在于通过精细化的用户管理和个性化的内容产出，来提升用户的忠诚度和生命周期价值。在这个过程中，内容产出的重要性不言而喻，它不仅是吸引用户关注的关键，更是推动用户转化和促进复购的动力源泉。
站长网2024-05-13 21:51:07
0000
站长资讯
DataStax集成LangChain，简化生成式AI应用程序的创建
划重点:1.DataStax与LangChain集成，旨在为开发者创建生成式AI应用程序提供便利，促进企业参与。2.集成使开发者能够轻松将AstraDB或ApacheCassandra添加为LangChain框架内的新矢量数据源。3.该集成对于初创企业和大型企业的开发者都具有重要意义，特别是在构建生成式AI应用程序时。
站长网2023-10-26 14:50:47
0002
站长资讯
2024年胡润百富榜发布：字节跳动张一鸣首次成为中国首富
今日，胡润研究院发布《2024胡润百富榜》，本次共有1，094位个人财富50亿元人民币以上的企业家登上今年胡润百富榜，比去年减少12%（147位）。上榜企业家总财富21万亿元，比去年下降10%(2.4万亿)。千亿级企业家比去年减少4位，至26位。十亿美金企业家比去年减少142位，至753位。
站长网2024-10-29 11:09:49
0000
站长资讯
小米与京东全面深化战略合作三年目标销售额2000亿
据小米官方消息，小米公司宣布与京东达成全新战略合作，小米集团合伙人、总裁及国际业务部总裁卢伟冰，京东集团CEO许冉出席仪式并见证战略签约。据悉，双方明确了未来三年小米在京东全渠道销售额2000亿的目标，同时将共同推动多品类小米智能硬件产品大众化普及，让更多用户享受到小米全场景智能化体验，加速「人车家全生态」战略全面展开。
站长网2024-05-13 10:26:44
0000
站长资讯
买手机建议“一步到位”：目前这5款手机很优秀，用三五年无压力
如果您喜欢，可以点击上面的“关注”二字。后续会为您提供更多有价值的内容。买手机建议“一步到位”：目前这5款手机很优秀，用三五年无压力。参考价格：2799元（12256GB）
站长网2023-05-23 15:17:43
0000