智源研究院推出FlagEval“天秤”大模型评测体系
站长网2023-06-09 20:57:130阅
在今日的2023北京智源大会上,智源研究院宣布推出FlagEval(天秤)大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发,结合超过600个维度对大模型进行全面测评。
据悉,天秤大模型的任务维度目前包含22个主观和客观评测数据集,共计超过84433道评测题目。
智源研究院院长黄铁军指出,大模型至少需要具备三个特点。第一,规模要大,需要达到百亿参数级别;第二,涌现性,能够产生预料之外的新能力;第三,通用性,不限于专门问题或者领域。
0000
评论列表
共(0)条相关推荐
万万没想到,你的微信根本不属于你!
玩了这么久的微信,你知道你的微信号并不属于你自己吗?注册微信的时候,用户都需要勾选《腾讯微信软件许可及服务协议》,但可能很多人,并没有从头至尾,认真读过这份协议。其实协议中已有约定:微信账号的所有权归腾讯公司所有,注册用户仅获得微信账号的使用权。换句话说,你的微信号,并不属于你。站长网2023-05-23 23:04:380000AI冲击下谁会失业?第一波游戏美术或已转完岗了
OpenAI旗下由人工智能驱动的多模态大语言模型ChatGPT,仅仅只用不到半年的时间就让AI重新成为了“风口”,给整个世界也带来了来自人工智能的震撼。关于ChatGPT,以及国内市场的文心一言、通义千问,大家在乐此不疲地试探人工智能的上限时,难免会有这样一个疑问,越来越聪明的这类人工智能产品究竟会让哪些职业被代替、哪些行业被颠覆呢?站长网2023-04-17 09:11:290000一抖音大V成新势力公敌?蔚来索赔500万后小鹏接着告
快科技7月13日消息,企查查官网显示,近日,广东小鹏汽车科技有限公司新增一则开庭公告信息,被告为顾某,案由为网络侵权责任纠纷(名誉权纠纷),该案将于8月29日在广州互联网法院开庭审理。据悉,在今年6月份,小鹏汽车法务部发布微博称已掌握数位造谣人身份,并启动司法维权程序,将采取法律手段追究责任。公开资料显示,顾某为抖音账号小牛说车”持有人,在小鹏汽车告它之前,蔚来已对其索赔500万。站长网2023-07-14 01:57:540000三星延长存储芯片产量削减计划 将专注高端人工智能芯片
三星电子在报告今年第二季度存储芯片部门运营亏损34亿美元(4.36万亿韩元)后,继续削减其存储芯片产量,包括用于智能手机和PC的NAND闪存。全球最大的存储芯片制造商公布,过去六个月其半导体业务运营亏损约70亿美元。此前,由于消费设备需求依然疲弱,三星在季度利润创下2009年以来最差季度利润后,于4月份大幅削减了存储芯片产量。站长网2023-07-27 16:33:370000ChatGPT安卓版已上线 率先在四个国家可以使用
ChatGPT安卓版本现已在GooglePlay商店中提供,该应用程序在免费的iOS应用程序将聊天机器人带到iPhone和iPad后几个月推出。根据该公司的一条推文,它首先在美国、印度、孟加拉国和巴西提供,其他国家将在稍后跟进,和之前iOS版本看到的分阶段推出一致。站长网2023-07-26 09:59:250002