工联院大模型测评:文心一言在工业领域表现超过GPT3.5
站长网2023-06-29 19:26:300阅
近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。
工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。
本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。
评测结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。
0000
评论列表
共(0)条相关推荐
国家药监局:加强网售平台监管 打击网络交易违法违规行为
据央视新闻消息,今日,国家药监局在国务院新闻办公室新闻发布会上指出,当前,我国药品、医疗器械、化妆品网络销售呈现出持续高速发展的态势。截至目前,药品、医疗器械、化妆品均已出台了专门的网络销售监督管理办法,明确了监管部门、经营企业和第三方平台的法律责任,强化网络销售监测和调查处置的规定,强调安全风险控制的措施,要求对网售全过程加强质量管理。站长网2023-07-05 19:13:330000仅次OpenAI!AI初创公司Inflection融资13亿美元 估值达40亿美元
日前,总部位于加州的AI初创公司Inflection宣布完成13亿美元的最新一轮融资,本次融资由微软、英伟达以及比尔·盖茨、埃里克·施密特、ReidHoffman(LinkedIn的创始人)牵头投资,英伟达也参与其中。站长网2023-06-30 19:48:450000理想反超问界夺得新势力销冠 单周销量达0.93万辆
今日,理想汽车公布了2024年第10周(3.4-3.10)的造车新势力单周销量数据,再次引起了市场的关注。在这份榜单中,理想汽车以0.93万辆的单周销量成绩,成功反超了问界的0.85万辆,重新夺回了造车新势力的销量冠军宝座。这一成绩不仅彰显了理想汽车在市场上的强大竞争力,也再次证明了其品牌和产品的影响力。站长网2024-03-12 16:54:560000Nightshade 工具助力创作者保护版权 对抗 AI 训练数据的滥用
站长之家(ChinaZ.com)10月26日消息:随着人工智能(AI)技术的快速发展,其训练数据的获取和使用变得日益重要,但也出现了滥用现象。为了抵御这种滥用,一款名为「Nightshade」的新工具应运而生,为创作者提供了一种保护他们创意作品不被无授权用于AI模型训练的方法。站长网2023-10-26 09:18:180000李彦宏:创新能力买不来 未来要有意识地培养「AI 原生应用」的思维方式和理念
百度创始人、董事长兼首席执行官李彦宏五四青年节在内部「新使命六周年暨百度骄傲颁奖典礼」上发表讲话,系统谈到了百度近十年来在AI上的重大战略判断与布局、文心一言的最新进展、大模型竞争的关键之战等。站长网2023-05-05 09:59:550001