Hugging Face发布高度优化的Zephyr-7B迷你语言模型 媲美70亿参数Llama-2
站长网2023-11-30 11:25:431阅
**划重点:**
1. 🌐 Hugging Face基于欧洲初创公司Mistral AI的开源模型Mistral7B,推出了Zephyr-7B迷你语言模型,并通过蒸馏监督微调(dSFT)方法对其进行了精细优化。
2. ⚙️ Zephyr-7B采用了蒸馏直接偏好优化(dDPO)方法,使用一组“教师”模型的输出作为偏好数据,显著缩短了训练时间,降低了所需资源。
3. 🌐在基准测试中,Zephyr-7B略胜Mistral7B,甚至可以媲美具有70亿参数的Llama-2。
在最新的人工智能实践中,Hugging Face推出了经过高度优化的Zephyr-7B迷你语言模型,该模型基于欧洲初创公司Mistral AI的开源模型Mistral7B。通过采用蒸馏监督微调(dSFT)方法,该模型得以精细调整,该方法利用较大的“教师”模型的输出来训练较小的“学生”模型。

与此同时,Zephyr-7B还引入了蒸馏直接偏好优化(dDPO)方法,该方法利用一组教师模型的人工智能反馈作为偏好数据。这一创新性方法显著降低了训练时间,并减少了所需的计算资源。

在基准测试中,Zephyr-7B展现出令人瞩目的性能。相较于Mistral7B,它稍显领先,并且在具有70亿参数的Llama-2模型面前也能媲美一些性能指标。这标志着Hugging Face在迷你语言模型领域的技术进步,为未来的人工智能发展奠定了坚实基础。
模型网址:https://huggingface.co/HuggingFaceH4/zephyr-7b-beta
0001
评论列表
共(0)条相关推荐
亚马逊Alexa部门面临裁员 公司将重点发展新形式AI
据公司周五的一份内部备忘录透露,亚马逊将裁减数百个Alexa部门的职位,这是公司进行更大范围业务重组的一部分,未来将更专注于开发新形式的人工智能技术。备忘录显示,此举是为了最大限度地利用公司在生成式人工智能方面的资源和努力。裁员将导致Alexa和FireTV部门数百个职位被裁。站长网2023-11-18 13:47:340001ChatGPT上线“论文神器”插件!无需关键字即可搜索2亿文章,链接绝对保真
ChatGPT上新了一个“论文搜索神器”插件,名叫“Consensus”。划重点:不用罗列关键字,只用一句话描述你想了解的问题,比如“xxxx有什么好处”、“xx对xx有何影响”。它就能从2亿篇论文中搜索并整理出来答案:每一个点都附上论文链接。甚至,根据你的问题写一篇简单的综述也行:当然,也是通过总结相关研究的方式,论文链接都会附上。站长网2023-09-06 18:41:480000去哪儿员工每周有2天可灵活办公 7月15日正式实施
今日,去哪儿网CEO陈刚在一封内部信中宣布,自7月15日起,公司将正式实施混合办公模式。根据这一新的工作安排,员工每周三和周五可以自由选择工作地点,无论是办公室还是远程工作,都无需经过繁琐的申请审批流程。据悉,这一混合办公政策主要面向在去哪儿网工作满6个月的正式员工。公司去年10月启动了为期9个月的混合办公试点,收集到的反馈非常积极。站长网2024-07-09 17:20:340000马斯克关注 OpenAI 董事会的神秘决策,因为 Sam Altman 的回归未能回答关键问题
近日,OpenAI的核心科学家IlyaSutskever和公司CEOSamAltman的命运在董事会中引发了广泛关注。马斯克,作为OpenAI的前联合创始人之一,对Sutskever在公司内部所见到的、足以使他采取行动解雇Altman的事情表现出浓厚兴趣。站长网2023-11-27 09:46:590000ChatGPT 落入大学生之手,6 个月后实现月收入 45 万元,代价:挂科两门!
ChatGPT浪潮来袭,大厂们正在紧锣密鼓地研发大模型,创业公司在垂直生态之下发力内容制作、工具等应用,不少一线开发者、爱好者则利用AI在提升工作效率之余也做起了兼职与副业生意。对此,也有一个名为MillionDollarAI的网站做了一个聚合页分享了这些基于已有AI模型而拓展研发的一些产品,其中有些现如今收益颇丰,令人生羡。站长网2023-05-25 18:15:490000