智谱开源新一代多模态大模型CogVLM2
智谱·AI最近宣布推出新一代多模态大模型CogVLM2,该模型在关键性能指标上相较于前一代CogVLM有了显著提升,同时支持8K文本长度和高达1344*1344分辨率的图像。CogVLM2在OCRbench基准上性能提升了32%,在TextVQA基准上性能提升了21.9%,显示出强大的文档图像理解能力。尽管CogVLM2的模型大小为19B,但其性能接近或超过了GPT-4V的水平。
CogVLM2的技术架构在上一代模型的基础上进行了优化,包括一个50亿参数的视觉编码器和一个70亿参数的视觉专家模块,这些模块通过独特的参数设置,精细地建模了视觉与语言序列的交互。这种深度融合策略使得视觉模态与语言模态能够更加紧密地结合,同时保持了模型在语言处理上的优势。此外,CogVLM2在推理时实际激活的参数量仅约120亿,这得益于其精心设计的多专家模块结构,显著提高了推理效率。
在模型效果方面,CogVLM2在多个多模态基准测试中取得了优异的成绩,包括TextVQA、DocVQA、ChartQA、OCRbench、MMMU、MMVet和MMBench等。这些测试涵盖了从文本和图像理解到复杂推理和跨学科任务的广泛能力。CogVLM2的两个模型在多个基准中取得了最先进的性能,同时在其他性能上也能达到与闭源模型相近的水平。
代码仓库:
Github:https://github.com/THUDM/CogVLM2
模型下载:
Huggingface:huggingface.co/THUDM
魔搭社区:modelscope.cn/models/ZhipuAI
始智社区:wisemodel.cn/models/ZhipuAI
Demo体验:
https://modelscope.cn/studios/ZhipuAI/Cogvlm2-llama3-chinese-chat-Demo/summary
CogVLM2技术文档:
https://zhipu-ai.feishu.cn/wiki/OQJ9wk5dYiqk93kp3SKcBGDPnGf
B站发布2024年Q2财报:毛利润同比增长49% 上半年实现24亿正向经营现金流
快科技8月22日消息,B站公布了截至2024年6月30日的第二季度未经审计的财务报告。第二季度,B站总营收同比增长16%,达61.3亿元人民币。其中,广告收入同比增长30%,游戏收入同比增长13%。随着高毛利的广告和游戏业务增长,二季度B站毛利润同比提升49%,毛利率连续8个季度环比提升至29.9%。此外,二季度B站实现17.5亿元正向经营现金流,上半年累计实现24亿元正向经营现金流。0000ChatGPT引发AI芯片荒,台积电成了英伟达身后的超级大赢家
1849年,美国加州发现金矿的消息传开后,淘金热开始了。无数人涌入这片新土地,他们有的来自东海岸,有的来自欧洲大陆,还有来到美国的第一代华人移民,他们刚开始把这个地方称为「金山」,后来又称为「旧金山」。但不管如何,来到这片新土地的淘金者都需要衣食住行,当然最关键的还是淘金的装备——铲子。正所谓「工欲善其事,必先利其器」,为了更高效地淘金,人们开始疯狂地涌向卖铲人,连带着财富。站长网2023-06-27 17:06:540002SEC 将考虑对券商制定新的人工智能规则 旨在解决利益冲突问题
站长之家(ChinaZ.com)6月14日消息:华尔街的主要监管机构正计划为使用人工智能与客户互动的券商引入新规定。美国证券交易委员会(SEC)周二表示,旨在控制与这项技术相关的利益冲突的计划可能最早于十月份推出。该提案还将适用于预测数据分析和机器学习。站长网2023-06-15 07:10:220000国家邮政局:今年我国快递业务量已达800亿件
国家邮政局监测数据显示,截至6月30日,今年我国快递业务量已达800亿件,比2023年提前59天。国家邮政局表示,今年以来,我国快递市场继续快速发展,月均业务量超130亿件。特别是进入6月以来,在电商平台年中大促等利好因素的带动下,快递日均业务量超5亿件,市场规模加快扩大,在促进消费、服务生产和保障民生等方面发挥了积极作用。站长网2024-07-01 18:15:430000大模型的航海时代,火山引擎拼命造船
在火山引擎位于海淀区大钟寺广场的办公楼见到谭待时,王慧文撤离大模型赛道的消息尚未传出,否则又会为这场专访提供一份堪称变量的背景。话虽如此,大模型依然是全球资本追逐的宠儿,AI概念股推动纳斯达克在2023年实现了29%的涨幅,中国的下场者也高密度的出现在各家大厂和各所高校的顶尖名册里,但在大规模应用的构想里,所有人都还在等待那个从酝酿到爆发的时间窗口。站长网2023-07-08 17:09:040001