工联院大模型测评:文心一言在工业领域表现超过GPT3.5
站长网2023-06-29 19:26:302阅
近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。
工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。

本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。
评测结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。
0002
评论列表
共(0)条相关推荐
沃顿商学院推出人工智能计划 鼓励学生人机思维共融
文章概要:1.沃顿商学院近日宣布成立“沃顿人工智能”计划,旨在推动学生深入了解人工智能的应用和商业世界的运用。2.该计划侧重于两个关键领域:商业人工智能与分析以及技术影响倡议,旨在研究其商业应用和社会影响。3.计划鼓励学生探索人机共融思维,将人工智能与人类智慧结合,共同推动社会进步。站长网2023-09-19 10:52:480000面壁智能发布端侧旗舰MiniCPM 性能超越 Mistral-7B
面壁智能于2月1日发布了旗舰端侧模型MiniCPM,它以小博大的性能超越了Mistral-7B,并在MT-Bench等榜单上表现出色。MiniCPM是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本,支持CPU推理。MiniCPM开源,并已在主流操作系统上进行了适配和测试。站长网2024-02-04 09:15:060002研究发现,ChatGPT在老年药物管理中展现潜力
划重点:⭐️研究发现AI聊天机器人ChatGPT可以作为药物管理工具,有助于处理老年多药疗法。⭐️超过40%的老年人符合多药疗法标准,AI工具有望减轻医生负担。⭐️研究呼吁持续完善AI工具,以提升医疗决策的准确性和可靠性。站长网2024-04-18 21:55:480000GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了
不开玩笑,电影《她》真的来了。OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。现场直播的效果更是炸裂:它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。站长网2024-05-14 08:59:280000一天利润500到1000+,小白可做,地推拉新项目赚钱攻略(附渠道)
最近几天有不少人问我,夏天了想去做地推,有没有什么建议和好的单子渠道,想业余时间去赚点钱。因为我以前做过两年多时间的拉新行业,很多人也都知道我曾经这个项目里也做出了一点成绩,想让我给点建议。站长网2023-07-06 14:58:380002