UC伯克利发布大语言模型榜单 清华ChatGLM冲进前五
站长网2023-05-05 11:10:181阅
日前,UC伯克利发起了大语言模型版排位赛,让大语言模型随机进行battle,并根据它们的Elo得分进行排名。
排行榜数据显示,Vicuna以1169分排名第一,Koala位列第二。这两个模型都有130亿参数。LAION的Open Assistant排在第三。
清华提出的ChatGLM,虽然只有60亿参数,但依然冲进了前五,只比130亿参数的Alpaca落后了23分。
相比之下,Meta原版的LLaMa只排到了第八(倒数第二),而Stability AI的StableLM则获得了唯一的800 分,排名倒数第一。
这个排位赛可以让人们更好地了解各个聊天机器人的表现,同时也能促进大语言模型的发展。该排位赛会把国内和国外的这些「闭源」模型都搞进来。目前,所有的评估代码以及数据分析均已公布。
团队表示,之后不仅会定期更新排位赛榜单,而且还会优化算法和机制,并根据不同的任务类型提供更加细化的排名。
0001
评论列表
共(0)条相关推荐
埃森哲首席技术官: AI时代,培养员工比投资科技更重要
**划重点:**1.🌐强调企业在AI时代应更注重培养员工适应变革,而非仅仅投资科技。2.🔄认为AI技术的有效运用需要智能信号和保持人类参与,以更好地处理技术中的人类知识。3.🤔表达对于AI引起的部分工作“整合”担忧,强调最大的关切是对不使用生成式AI的人员的工作。0000用AI教人说“土味情话”,RizzGPT快速冲到美国iOS生活榜二
RizzGPT美国市场快速冲榜。编辑部在日常巡榜时发现,AI驱动的“土味情话”应用RizzGPT7月11日位列美国iOS免费总榜排名58,非游戏应用免费榜排名53,生活分榜第2。站长网2023-07-12 17:26:090000微软暗示带有第三方人工智能插件的 Windows 11 Copilot 即将推出
站长之家(ChinaZ.com)7月31日消息:微软的WindowsCopilot插件支持即将推出,并且微软正在征求开发者的反馈,以帮助塑造操作系统的「第三方AI插件」的未来。此次调查是在WindowsLatest报道揭示了「第一方AI插件」存在的情况后进行的,这些插件弥补了Bing驱动的Copilot和Windows11之间的差距。站长网2023-07-31 10:02:270001AMD 首席执行官:AI 半导体在今后 3~4 年里将年均增长 50%
AMD首席执行官苏姿丰日前接受日本经济新闻采访时表示,用于人工智能(AI)的半导体市场将在今后3~4年里年均增长50%。AMD将推出用于AI处理的高性能半导体,追赶在该领域排在世界首位的英伟达。苏姿丰预测,未来3-4年内,人工智能半导体市场将从目前的数百亿美元增长到1500亿美元。生成式人工智能在医疗、金融和制造业等领域得到广泛应用,需要高性能半导体来瞬间处理庞大的数据。站长网2023-07-24 22:17:310000对话快手直播公会区域运营负责人:区域运营给行业带来了哪些发展新机遇?
今年下半年,快手直播举办了一场主题为《区域新机遇直播新发展》的线下沙龙,首次对外公开宣讲区域运营。区域运营,指的是直播平台将全国划分成多个不同的区域,如华东地区、华南地区和东北地区等。平台会在每个区域成立对应的运营团队,他们会与区域内的公会高频交流,给予定期指导、制定发展规划等。站长网2023-12-06 17:58:360002