昆仑万维:天工大模型推理能力超过GPT-3.5和LLaMA2
站长网2023-09-18 08:34:110阅
昆仑万维表示,其自研的天工大模型在 Benchmark GSM8K 测试中取得了80% 的正确率,超过了 GPT-3.5和 LLaMA2-70B,达到了全球领先水平,接近于 GPT-4。
天工大模型还在 MMLU、C-EVAL、HumanEval 等多个数据集上表现出色,准确率均高于其他主流大模型。同样,在中文开源数据集 CMATH 测试中,天工大模型也表现优秀,准确率超过了其他主流大模型。
昆仑万维表示,天工大模型的优秀表现得益于其对多数据源的高效融合策略、不同语言间的能力迁移以及对基座逻辑推理能力的深入探索。与 GPT-3.5相比,天工大模型的解题思路更为简单、清晰。
天工大模型目前仍处于内测阶段,将持续提升技术实力,为用户和企业提供强大的智能化助力。
0000
评论列表
共(0)条相关推荐
Wix 推出 AI 网站生成器:可以根据文本提示构建整个网站
站长网2023-07-18 12:30:540000从VR试妆到AI应用,Lazada的东南亚爆品方法论
2018年9月,李佳琦成功挑战“30秒涂口红最多人数”的吉尼斯世界纪录,并成为涂口红的世界纪录保持者。随后的双十一”,李佳琦与马云在直播间PK卖口红,秒表摁下,李佳琦卖出了1000支口红,自此李佳琦“口红一哥”的称号再无人与之争锋。在东南亚头部电商平台Lazada内部也有一个无人与之争锋的“口红一哥”,他不是靠涂口红成名,而是靠黑科技让在线涂口红不再失真。0000不到 600 行代码实现了《愤怒的小鸟》翻版,GPT-4+DALL·E 3+Midjourney撼动游戏圈
把草图变网站,用几秒复现一款经典小游戏...随着GPT-4与Midjourney、DALL•E3等AIGC工具的强强联合,其带给游戏行业的震撼不是一星半点。站长网2023-11-02 15:07:580004SK 海力士称内存芯片复苏已经开始 人工智能需求强劲
韩国SK海力士周三表示,由于人工智能需求强劲,内存芯片市场正在从严重低迷中复苏,尽管其报告显示第二季度运营亏损。特别是企业买家和游戏个人电脑对内存芯片的需求预计将在今年下半年比上半年增加,这家全球第二大内存芯片制造商在一份声明中表示。站长网2023-07-26 11:20:480000字节大模型新进展:首次引入视觉定位,实现细粒度多模态联合理解,已开源&demo可玩
字节大模型,BuboGPT来了。支持文本、图像、音频三种模态,做到细粒度的多模态联合理解。答哪指哪,什么讲了什么没讲,一目了然:除了有“慧眼”,还有“聪耳”。人类都注意不到的细节BuboGPT能听到:Audio-1-chime-bird-breeze,量子位,20秒前方高能!三模态联合理解,文字描述图像定位声音定位,一键搞定,准确判断声音来源:站长网2023-08-15 20:27:170001