昆仑万维:天工大模型推理能力超过GPT-3.5和LLaMA2
站长网2023-09-18 08:34:110阅
昆仑万维表示,其自研的天工大模型在 Benchmark GSM8K 测试中取得了80% 的正确率,超过了 GPT-3.5和 LLaMA2-70B,达到了全球领先水平,接近于 GPT-4。
天工大模型还在 MMLU、C-EVAL、HumanEval 等多个数据集上表现出色,准确率均高于其他主流大模型。同样,在中文开源数据集 CMATH 测试中,天工大模型也表现优秀,准确率超过了其他主流大模型。
昆仑万维表示,天工大模型的优秀表现得益于其对多数据源的高效融合策略、不同语言间的能力迁移以及对基座逻辑推理能力的深入探索。与 GPT-3.5相比,天工大模型的解题思路更为简单、清晰。
天工大模型目前仍处于内测阶段,将持续提升技术实力,为用户和企业提供强大的智能化助力。
0000
评论列表
共(0)条相关推荐
QQ浏览器电脑版v12.7上线手机模式 可实现手机和电脑同屏操作
QQ浏览器电脑版v12.7推出了一系列新功能,旨在提升用户的办公和娱乐体验。主要亮点包括:手机模式:用户可以在电脑上下载和安装20多款热门手机App,如微信读书、QQ、斗地主等,实现手机和电脑同屏操作,方便用户在不同设备间切换。PDF转换工具:浏览器内置了PDF侧边栏,提供转换、编辑和提取文字等功能,帮助用户轻松处理PDF文件。站长网2024-07-25 02:34:310000读光团队开源商用票证OCR检测矫正模型
读光团队开源了商用票证检测矫正模型,可应对多种复杂场景。模型具有高准确率和支持多卡证票据等特点。使用该模型进行票证信息抽取的流程包括预处理、文本检测、文本识别、信息抽取和信息验证等步骤。可以结合其他开源模型进行组合,实现DIY票证信息抽取应用。该模型具有以下优点:1.支持任意角度、多卡证票据等混贴场景,能够检测输入图像中任意角度的多个子图区域。站长网2023-12-07 09:31:490001手握10万主播达人,无忧传媒攻不下电商
无忧传媒持续加码电商直播业务,与互联网监管日趋严格,秀场直播行业有关。虽然目前无忧传媒已经在电商直播赛道展露头角,但值得注意的是,目前其仅有几个知名的电商主播,与超十万的主播达人大盘相比,显得微不足道。为了扩大电商业务的影响力,无忧传媒已不满足于抖音内部的流量。站长网2023-07-04 16:18:100001独立开发变现周刊(第114期):一个简单截图API,月收入2千美金
1、miniPaint:开源Photoshop网页替代在线图像编辑器,开源,Photoshop替代品。允许使用HTML5技术创建、编辑图像。不需要购买,下载,安装或有过时的flash。主要功能:图层,滤镜等。有在线网址可以体验。miniPaint直接在浏览器中运行。可以创建图像,从剪贴板粘贴(ctrlv)或本机上传。不会向任何服务器发送任何内容。一切都停留在浏览器中。站长网2023-12-01 08:56:360001字节小游戏平台摸摸鱼将关闭 运营时间不到3年
摸摸鱼游戏平台在微信公号上发布公告,宣布将于2024年3月29日结束运营,届时虚拟资产将不再有效。公告中提到,玩家如果想继续玩已下载的游戏,可以从正规的应用商店或游戏官方网站等渠道重新安装相同的游戏软件,但是摸摸鱼平台无法为每个游戏提供游戏账号转移的解决方案,游戏账号和游戏进度可能会丢失。站长网2024-01-30 17:34:410000