天津大学大模型评测报告:GPT-4和百度文心一言显著领先
站长网2023-08-15 08:42:201阅
8月12日,天津大学和信创海河实验室举办了一次大模型技术与评测研讨会,会上发布了首份大模型评测报告。
该报告对国内外14个大语言模型进行了中文综合能力评测,结果显示,GPT-4和百度文心一言相对于其他模型综合性能领先。
在此次评测中,GPT-4对参评模型的主观题回答进行了打分,结果显示,GPT-4认为文心一言生成的中文内容质量更高。相比人工评价,在基于 GPT-4的自动评测中,文心一言的总得分超过了 GPT-4,位居榜首。
天津大学表示,大模型有望重塑人工智能的发展模式,国产大模型正在迎头赶上国际类似模型,并在某些指标上实现了超越。百度文心一言在评测中展现了强大的实力,具备了在相关行业落地的技术基础。
百度表示,百度在大模型生态的构建上具备先发优势,目前已经有15万家企业申请接入文心一言测试。
0001
评论列表
共(0)条相关推荐
大模型走捷径「刷榜」?数据污染问题值得重视
我直接看答案。生成式AI元年,大家的工作节奏快了一大截。特别是,今年大家都在努力卷大模型:最近国内外科技巨头、创业公司都在轮番推出大模型,发布会一开,个个都是重大突破,每一家都是刷新了重要Benchmark榜单,要么排第一,要么第一梯队。在兴奋于技术进展速度之快后,很多人发现似乎也有些不对味:为什么排行榜第一人人有份?这是个什么机制?于是乎,「刷榜」这个问题也开始备受关注。站长网2023-11-09 15:03:110000美团在成都成立新公司,经营范围含智能机器人研发和AI软件开发
据天眼查显示,美团最近在成都成立了一家名为成都海骑科技有限公司的新公司。该公司的经营范围包括智能机器人的研发、物联网技术研发、人工智能基础软件开发、网络与信息安全软件开发、信息技术咨询服务和互联网数据服务等。据股权信息显示,该公司由美团旗下SolidBitHongKongLimited间接全资持股。0000人工智能大战:亚马逊 AWS 重磅投入生成式 AI 向微软和谷歌发起挑战
站长之家(ChinaZ.com)12月2日消息:亚马逊的AWSre:Invent开发者大会本周拉开帷幕,一系列重磅公告显示出亚马逊正在努力迎头赶上AI领域的佼佼者和主要竞争对手微软。作为亚马逊至关重要的亚马逊网络服务(AWS)业务的年度展示窗口,今年的会议重点放在了生成式AI上,力图抗衡微软和谷歌在市场上的早期主导地位。0000阿里魔搭社区开源一站式视频生成工具MotionAgent
近日,阿里巴巴达摩院旗下魔搭社区(ModelScope)宣布开源一站式视频生成工具MotionAgent。MotionAgent集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。使用MotionAgent可以通过输入创意和描述,让AI帮助生成剧本、剧照、视频和音乐。站长网2023-09-01 11:32:550000钉钉工作台支持「 AI 生成应用图标」 可快速更换风格
钉钉工作台宣布新增功能,支持AI生成应用图标,让用户可以快速更换工作台图标的风格。主要内容包括:支持AI批量生成图标:管理员可以在工作台设置中选择“生成图标”,然后按需选择合适的风格和颜色。共有5种风格,每种风格都有7种颜色。用户可以先预览效果,确认后生成所有图标,省时高效。同时还可以保留图标替换记录,可以随时恢复历史效果。站长网2024-03-12 08:47:590000