智谱 AI 开源视觉语言模型 CogAgent 支持GUI图形界面问答
站长网2023-12-21 08:50:341阅
智谱 AI 开源了 CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在 GUI 理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。
它还支持高分辨率的视觉输入和对话问答,并且可以针对任意 GUI 截图进行问答。
模型可以通过上传截图来进行任务推理,并返回计划、下一个动作以及具体操作的坐标信息。
CogAgent 还支持 OCR 相关任务,通过预训练和微调,其能力得到了显著提升。
Github:
https://github.com/CogNLP/CogAGENT
cogagent-chat:
https://modelscope.cn/models/ZhipuAI/cogagent-chat/summary
cogagent-vqa:
https://www.modelscope.cn/models/ZhipuAI/cogagent-vqa/summary
0001
评论列表
共(0)条相关推荐
软银集团计划出售大部分阿里巴巴持股 价格与 2014 年买入时相当
站长之家(ChinaZ.com)4月13日消息:据WSJ消息,有报道称软银集团已着手出售在阿里巴巴集团控股有限公司的大部分持股。FinancialTimes周三援引对监管文件的分析报道称,软银今年已通过预付远期合约出售了约72亿美元的阿里巴巴股票,这将使其持股比例最终降至3.8%。站长网2023-04-13 09:49:420001AMD 称人工智能是其头号战略重点 今年晚些时候 Instinct MI300 将引领潮流
AMD公司的首席执行官苏姿丰博士在最近的财报电话会议上指出,AMD把未来的发展寄托在人工智能上,InstinctMI300将领跑。站长网2023-05-05 20:37:430000苹果联合创始人:人工智能可能使诈骗和错误信息更难被发现
苹果公司联合创始人史蒂夫·沃兹尼亚克(SteveWozniak)警告说,人工智能(AI)可能使诈骗和错误信息更难发现。沃兹尼亚克说,他担心这项技术会被「坏人」所利用。他在接受英国广播公司采访时说,人工智能的内容应该有明确的标签,并且需要对这个行业进行监管。这位计算机先驱在3月与埃隆·马斯克一起签署了一封公开信,呼吁暂停开发最强大的人工智能模型。站长网2023-05-09 16:46:080000蚂蚁集团入股认知大模型研发公司智谱AI
天眼查显示,10月17日,北京智谱华章科技有限公司发生工商变更,新增股东为蚂蚁集团子公司上海云玡企业管理咨询有限公司。站长网2023-10-18 21:20:110000OnePlus谁在用?总裁:不想用iPhone,又看不上其他手机的人!
站长之家(ChinaZ.com)11月23日消息:近日,OnePlus中国区总裁李杰(Louis)日前通过微博揭示了OnePlus品牌的独特吸引力,强调这是为那些不愿意随波逐流,不想使用苹果,又对其他手机不感兴趣的用户设计的。这一言论引发了广泛的关注和讨论。站长网2023-11-23 11:29:540000