Stability AI新开源LLM项目“FreeWilly”表现优于 Meta 的 Llama 2
站长网2023-07-24 15:03:160阅
Stability AI 与 CarperAI 发布了两个新的大型语言模型,名为 FreeWilly。其中一个模型基于 Meta 的 Llama v2,通过优化性能展示了开源开发的速度。
两个 FreeWilly 模型均基于 Meta 的 Llama 模型,其中 FreeWilly2已使用具有700亿个参数的较新的 Llama-2模型。FreeWilly 团队自己的努力是使用“高质量指令”生成的新合成数据集进行“仔细微调”。
FreeWilly 团队使用微软的 “Orca 方法” 训练小型模型逐步推理,而不是简单地模仿大型模型的输出风格。他们创建了一个包含600,000个数据点的数据集,相比于 Orca 团队使用的数据集只占了10% 左右。
在常见的基准测试中,以这种方式训练的 FreeWilly 模型在某些逻辑任务中表现出与 ChatGPT 相当的结果,其中基于 Llama2的 FreeWilly2模型优于 FreeWilly1。
总体而言,FreeWilly2在性能上领先于 Llama v2约4%,这表明 Meta 的新标准模型仍有改进的空间,并且开源社区可以提供帮助。
FreeWilly2目前在性能最佳的开源模型列表中处于领先地位,而原始的 Llama2在通用语言理解基准测试 MMLU 上略微领先。
FreeWilly 模型在开放访问大型语言模型领域树立了新标准,推动了研究并增强了自然语言理解和复杂任务的实现。这些模型可免费用于研究目的,并且 FreeWilly2被认为是在基准测试中具有最佳平均结果的开源模型。
项目网址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
0000
评论列表
共(0)条相关推荐
BIMlogic 推出革命性 AI 助手,Revit 将由自然语言人工智能驱动
澳大利亚的BIMlogic公司近日宣布了其最新的创新产品——BIMlogicCopilot,这是一款旨在彻底改变用户与Revit设计环境互动方式的AI助手。BIMlogicCopilot的推出,标志着在建筑信息模型(BIM)领域的一次重大突破。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-11-24 10:10:530001LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
划重点:1.LangSplat是一种基于传统3D高斯技术的人工智能方法,用于在3D环境中进行开放式语言查询,以解决当前方法在处理速度和准确性方面的限制。2.该方法使用了独特的3D语言领域构建和语言嵌入技术,通过场景级语言自动编码器减少内存使用,并通过SegmentAnythingModel(SAM)解决复杂场景中的点模糊问题。站长网2024-01-18 11:25:450000苹果公司计划最早在 2024 年底的 iOS 18 和 iPadOS 18 上推出生成式 AI 功能
站长之家(ChinaZ.com)10月20日消息:据海通国际证券投资公司的供应链分析师JeffPu称,苹果计划最早在2024年底开始在iPhone和iPad上推出生成式人工智能技术。站长网2023-10-20 09:25:180000Jeli将生成式人工智能引入事件报告分析
当一个重大的系统故障发生时,会有大量的在线和离线沟通进行。在线部分会创建一个数字审计轨迹,记录了什么时候发生了什么,人们如何反应,以及最终问题是如何解决的。Jeli是一家几年前成立的公司,旨在帮助企业理解和跟踪故障。今天,该公司宣布了其方法的下一个合乎逻辑的步骤——一款将ChatGPT类似的功能引入故障管理的测试版。站长网2023-08-11 11:17:160000AMD 的 AI 芯片转单给三星可能性不大 与台积电已合作至 2nm 制程
站长之家(ChinaZ.com)7月18日消息:据DIGITIMES消息,英伟达AIGPU出货逐季飙升,接下来AMDMI300系列将在第4季底量产。站长网2023-07-18 17:22:550000