昆仑万维:天工大模型推理能力超过GPT-3.5和LLaMA2
站长网2023-09-18 08:34:110阅
昆仑万维表示,其自研的天工大模型在 Benchmark GSM8K 测试中取得了80% 的正确率,超过了 GPT-3.5和 LLaMA2-70B,达到了全球领先水平,接近于 GPT-4。
天工大模型还在 MMLU、C-EVAL、HumanEval 等多个数据集上表现出色,准确率均高于其他主流大模型。同样,在中文开源数据集 CMATH 测试中,天工大模型也表现优秀,准确率超过了其他主流大模型。
昆仑万维表示,天工大模型的优秀表现得益于其对多数据源的高效融合策略、不同语言间的能力迁移以及对基座逻辑推理能力的深入探索。与 GPT-3.5相比,天工大模型的解题思路更为简单、清晰。
天工大模型目前仍处于内测阶段,将持续提升技术实力,为用户和企业提供强大的智能化助力。
0000
评论列表
共(0)条相关推荐
Meta计划本周推出开源AI编程软件Code Llama
Meta计划推出开源AI软件CodeLlama,旨在帮助开发人员自动生成编程代码。这款开创性的产品将挑战OpenAI和Google等科技巨头的专有软件。CodeLlama是一个开源人工智能模型,预计将于本周推出。此外,Meta还在开发名为CodeCompose的AI辅助代码编写工具。该工具已经扩展到Meta的数万名开发人员,涵盖多种编程语言和编码界面。站长网2023-08-21 14:36:320000Meta AI推出新功能 包括群聊中重新创作AI图像和对Reels的支持
站长之家(ChinaZ.com)12月7日消息:MetaAI今天宣布推出一系列新功能,旨在增强用户在群聊中的体验。其中一个新功能叫做“重新想象”,允许用户通过在提示下重新创建AI图像,为群聊增添更多趣味性。另一个新功能是对Reels的支持,用户可以通过MetaAI查看与查询匹配的事物的可视化示例。站长网2023-12-07 09:45:5900002022年全球电动车销量排行榜前十名出炉:中国霸气占7席
快科技5月13日消息,近日海外汽车媒体Motor1”公布了2022年全球纯电动车销量排名,特斯拉两款主销车上榜,而中国则霸占了7席。来看具体榜单,第一二名均来自特斯拉,分别为ModelY和Model3,对应年销量74.75万辆和48.22万辆,同比2021年增幅为91%和-3%。站长网2023-05-13 17:08:200000研究发现,ChatGPT 能理解和回应人类情感
划重点:-研究发现,ChatGPT能理解和回应人类情感,当提示中包含情感因素时,聊天机器人的回答效果更好。-该研究表明,LLMs(大型语言模型)如ChatGPT可能能够“理解和回应情感暗示”。-如果ChatGPT确实能够理解人类情感,并且在提示中包含情感角度时能够更好地回应,那么我们可能离AGI更近一步了。站长网2023-11-16 17:55:550000AI 大模型落地尚需时间 预计未来投资重心逐渐向云计算和软件 SaaS 领域迁移
站长之家(ChinaZ.com)10月8日消息:中信证券日前发布研究报告称,伴随AI应用逐渐向纵深方向演进,投资机会将从GPU产业链进一步扩展至云计算、数据中心IDC、液冷等产业链。预计智能云占比较高的云计算公司将受益。站长网2023-10-08 18:03:260002