Stability AI新开源LLM项目“FreeWilly”表现优于 Meta 的 Llama 2
站长网2023-07-24 15:03:160阅
Stability AI 与 CarperAI 发布了两个新的大型语言模型,名为 FreeWilly。其中一个模型基于 Meta 的 Llama v2,通过优化性能展示了开源开发的速度。
两个 FreeWilly 模型均基于 Meta 的 Llama 模型,其中 FreeWilly2已使用具有700亿个参数的较新的 Llama-2模型。FreeWilly 团队自己的努力是使用“高质量指令”生成的新合成数据集进行“仔细微调”。
FreeWilly 团队使用微软的 “Orca 方法” 训练小型模型逐步推理,而不是简单地模仿大型模型的输出风格。他们创建了一个包含600,000个数据点的数据集,相比于 Orca 团队使用的数据集只占了10% 左右。
在常见的基准测试中,以这种方式训练的 FreeWilly 模型在某些逻辑任务中表现出与 ChatGPT 相当的结果,其中基于 Llama2的 FreeWilly2模型优于 FreeWilly1。
总体而言,FreeWilly2在性能上领先于 Llama v2约4%,这表明 Meta 的新标准模型仍有改进的空间,并且开源社区可以提供帮助。

FreeWilly2目前在性能最佳的开源模型列表中处于领先地位,而原始的 Llama2在通用语言理解基准测试 MMLU 上略微领先。
FreeWilly 模型在开放访问大型语言模型领域树立了新标准,推动了研究并增强了自然语言理解和复杂任务的实现。这些模型可免费用于研究目的,并且 FreeWilly2被认为是在基准测试中具有最佳平均结果的开源模型。
项目网址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
0000
评论列表
共(0)条相关推荐
霸王餐平台盛行,谁在为免费午餐买单?
最近两周,编辑部同事间有了一句新的问候语:“今天你吃霸王餐了吗?”在把饭送进嘴里前,常能看到有人触电一样放下筷子拿起手机:“还没拍照呢!”忘记拍照的同事甲甚至想翻垃圾桶找到自己吃光的外卖盒,只为拍下一个返图。在我们之间掀起波澜的是一个点外卖给好评可以返利的平台:平时正常下单外卖要花20-30块,给个好评就能拿回15-20块。据多位长期用户透露,自己已经拿到超过1万元的返现。站长网2023-11-20 09:21:240001为满足国内市场需求 特斯拉将针对Cybertruck进行碰撞保护改进
快科技11月29日消息,特斯拉正计划对中国市场的Cybertruck进行工程改进,以满足中国行人碰撞保护标准,这可能预示着这款纯电动皮卡即将正式引入中国。目前,特斯拉正在对Cybertruck进行两项具体的工程改进,但细节尚未公布。Cybertruck以其独特的设计风格和不锈钢车身而闻名,能够抵抗高速冲击。0000一个月涨粉400万,数百万人挤爆直播间,00后魔改的《植物大战僵尸》火了
还记得《植物大战僵尸》吗?最近,这个曾在15年前爆火的经典游戏“文艺复兴”了,网友们为之疯狂上头,起早摸黑地抓住一切可利用时间大战一把僵尸,微博、小红书、虎扑等社交平台掀起讨论热潮,甚至沉寂已久的植物大战僵尸贴吧,都再次“人声鼎沸”。不过,这一波复兴的并不是记忆中的官方原版《植物大战僵尸》,而是由叫“潜艇伟伟迷”的游戏博主自创的“杂交版”。站长网2024-06-26 23:22:510000OPPO Reno11超级标准版公布:将搭载深度调教天玑8200处理器
OPPOReno11超级标准版已经正式公布,这款手机将搭载联发科深度调教的天玑8200处理器,性能强劲且省电。据称,该手机可以达到103万分的安兔兔跑分,是目前表现最好的天玑8200手机。站长网2023-11-20 10:56:200000AI应用商店是门好生意,可要如何说服开发者入驻?
无论EpicGames、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这一套体系。站长网2024-08-27 07:25:230000