工联院大模型测评:文心一言在工业领域表现超过GPT3.5
站长网2023-06-29 19:26:302阅
近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。
工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。
本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。
评测结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。
0002
评论列表
共(0)条相关推荐
视频号新增朋友圈点赞可见功能
站长网2023-07-13 17:55:320000自2017年以来,印度采用人工智能技术组织的数量增长2.5倍
本文概要:1.印度组织采用人工智能技术的数量增加了2.5倍。2.人工智能在教育、健康、金融、制造等领域广泛应用。3.印度政府计划制定全球法律规范人工智能技术。根据印度国家电子和信息技术部长的回答,自2017年以来,印度采用人工智能技术的组织数量增长了2.5倍。站长网2023-08-14 10:50:330000卷完参数后,大模型公司又盯上了“长文本”?
4000到40万token,大模型正在以“肉眼可见”的速度越变越“长”。长文本能力似乎成为象征着大模型厂商出手的又一新“标配”。站长网2023-10-12 14:39:250000ElevenLabs发布配音API 允许开发者在产品中添加音频或视频翻译功能
ElevenLabs近日发布了配音API,允许开发者在其产品中添加音频或视频翻译功能。利用该API,开发者可以将任意音频或视频翻译成29种语言,并且保留原始发言者声音的独特特征。为帮助开发者快速上手,ElevenLabs提供了Python教程和API参考,让他们可以轻松将API整合到主要编程语言中。站长网2024-05-15 09:35:550001OpenAI首次将一家AI初创公司拉入黑名单 因违反API使用政策
划重点:🚫OpenAI封禁DelphiAIInc.开发的Dean.Bot,违反了API使用政策。🤖Dean.Bot模仿民主党总统候选人DeanPhillips,通过GPT-4提供实时对话。📢OpenAI强调不允许开发用于政治活动和虚拟人物模仿的应用,以防止滥用。站长网2024-01-22 10:00:290000