工联院大模型测评：文心一言在工业领域表现超过GPT3.5

站长网2023-06-29 19:26:302阅

近期，中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示，百度文心一言表现超过GPT3.5，综合评价指数在国内排名第一。

工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。

本次工业知识问答测试主要分为客观题与主观题两大类，总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。

评测结果显示，GPT4表现最佳。国内头部大模型表现亮眼，整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5，在国内大模型中排名第一。

工联院大模型测评文心一言在工业领域表现超过GPT35

0002

评论列表

共(0)条

相关推荐

站长资讯
疯狂开店的零食集合店，“快开快关”的创业梦
2023年，零食集合店正不断发力。仅仅是上半年，就先后有“赵一鸣零食”、“零食有鸣”等零食集合店品牌赢得资本青睐。其中，在五月就有“邻食魔珐”宣布已获近千万元天使轮融资，“零食有鸣”宣布获得B轮融资。除了在资本市场饱受关注，这些零食集合店品牌的扩店速度也是如零食界的“蜜雪冰城”，尤其是在下沉市场疯狂靠加盟商攻城略地。
站长网2023-05-24 21:38:43
0000
站长资讯
预计到2031年，合成数据生成市场规模将达到 35 亿美元
本文概要:1.全球合成数据生成市场预计在2031年达到35.8%的复合年增长率，市值将达到35亿美元。2.合成数据生成市场的增长受到数字化转型和人工智能等先进技术的推动，以及对物联网和连接设备的需求增加的影响。3.合成数据生成技术可以满足数据隐私和安全的需求，并提供一种可扩展的方法来生成各种数据集。
站长网2023-08-14 16:39:15
0000
站长资讯
OpenAI 希望 GPT-4 解决大规模内容审核难题：可取代大量人类审核员
OpenAI坚信其技术能够帮助解决技术领域最困难的问题之一：大规模内容审核。OpenAI声称，GPT-4可以取代成千上万名人工审核员，准确率几乎相当且更加一致。如果这是真的，技术领域中最具有毒性和精神压力的任务可以被外包给机器完成。
站长网2023-08-16 11:13:14
0000
AI 原生时代，字节想要复刻第三次增长奇迹
2024年被业内称为「AI应用元年」，字节跳动布局AI的节奏明显加快了。过去一年，字节推出十余款AI应用，覆盖Agent定制、聊天、社交、图像/视频、办公、教育等多个领域，甚至还涉足了硬件产品。移动互联网时代，字节就有「APP工厂」之称，所以相继打造今日头条和抖音两个爆款产品，借此成为最赚钱的中国互联网公司之一。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网站长资讯2024-11-02 11:45:33
0000
站长资讯
AI视野：百度希壤与高通达成合作；gpt4最强对手claude pro上线；快手内测AI文生图功能；Vercel发布界面生成器v0.dev
🤖📱💼AI应用gpt4迎来最强对手，claudepro正式上线Anthropic推出面向消费者的高级订阅计划ClaudePro，该计划每月收费20美元，相比于免费版Claude2，拥有更多的使用量、早期访问新功能的权限和更强大的上下文处理能力。然而，与ChatGPTPlus相比，ClaudePro在信息准确性方面稍逊一筹。要点:
站长网2023-09-15 16:28:35
0000