Hugging Face发布高度优化的Zephyr-7B迷你语言模型 媲美70亿参数Llama-2
站长网2023-11-30 11:25:431阅
**划重点:**
1. 🌐 Hugging Face基于欧洲初创公司Mistral AI的开源模型Mistral7B,推出了Zephyr-7B迷你语言模型,并通过蒸馏监督微调(dSFT)方法对其进行了精细优化。
2. ⚙️ Zephyr-7B采用了蒸馏直接偏好优化(dDPO)方法,使用一组“教师”模型的输出作为偏好数据,显著缩短了训练时间,降低了所需资源。
3. 🌐在基准测试中,Zephyr-7B略胜Mistral7B,甚至可以媲美具有70亿参数的Llama-2。
在最新的人工智能实践中,Hugging Face推出了经过高度优化的Zephyr-7B迷你语言模型,该模型基于欧洲初创公司Mistral AI的开源模型Mistral7B。通过采用蒸馏监督微调(dSFT)方法,该模型得以精细调整,该方法利用较大的“教师”模型的输出来训练较小的“学生”模型。
与此同时,Zephyr-7B还引入了蒸馏直接偏好优化(dDPO)方法,该方法利用一组教师模型的人工智能反馈作为偏好数据。这一创新性方法显著降低了训练时间,并减少了所需的计算资源。
在基准测试中,Zephyr-7B展现出令人瞩目的性能。相较于Mistral7B,它稍显领先,并且在具有70亿参数的Llama-2模型面前也能媲美一些性能指标。这标志着Hugging Face在迷你语言模型领域的技术进步,为未来的人工智能发展奠定了坚实基础。
模型网址:https://huggingface.co/HuggingFaceH4/zephyr-7b-beta
0001
评论列表
共(0)条相关推荐
因谷歌业绩低迷,AI相关公司市值损失1900亿美元
**划重点:**-📉**股市震荡:**在微软和谷歌母公司Alphabet发布令人失望的季度业绩后,AI相关公司股市市值在周二损失了高达1900亿美元。-🤔**投资者谨慎:**技术公司在AI上过度承诺、缺乏明确的盈利路径可能导致投资者对科技公司产生担忧,尤其是在高昂基础设施扩展成本面前。站长网2024-02-01 09:43:410000百度版大模型应用商店来了!从数字人到企业搜索11大应用应有尽有
大模型应用最新进展,扎堆来了!就在刚刚,大模型加持的“貂蝉”在线下一亮相,直接引爆现场热度。不仅衣着精致、能歌善舞:还能和现场热络互动、对答如流,主打的就是一个“机智”。这还只是身处“大模型重构一切”这场技术风暴中的百度,最新推出的11个AI原生应用中的一款。除了被大模型赋予“灵魂”的数字人,百度的看家本领搜索,如今也展现出了更强的形态:站长网2023-09-06 17:47:510000高通腾讯音乐推出 “骁龙臻品音质” 利用AI丰富音乐细节
高通技术公司和腾讯音乐娱乐集团合作推出了业界首创的“骁龙臻品音质”。通过利用骁龙移动平台的强大AI计算性能,在终端侧高效运行QQ音乐臻品音质AI模型算法,为用户带来更丰富的音乐细节、更有层次的听感以及更持久的音乐享受时长。该技术将作为QQ音乐超级会员的音频聆听选项上线,并限时专享于使用搭载骁龙移动平台智能手机的用户。站长网2023-09-27 10:51:060002携程客服官宣提前一个月回家过年:2025年春节可回乡办公48天
快科技5月7日消息,携程集团今天正式宣布,客服团队全面推行春节回乡办公政策,各客服团队可根据实际需求,实施该政策。以2025年春节为例,员工可申请2024年12月29日至2025年2月15日回乡办公,携程同步发布了与之匹配的员工申请和管理流程。在成为国内首家率先实施混合办公政策的企业之后,携程将混合办公延长至春节期间一个半月的超长时间。0000小米与京东全面深化战略合作 三年目标销售额2000亿
据小米官方消息,小米公司宣布与京东达成全新战略合作,小米集团合伙人、总裁及国际业务部总裁卢伟冰,京东集团CEO许冉出席仪式并见证战略签约。据悉,双方明确了未来三年小米在京东全渠道销售额2000亿的目标,同时将共同推动多品类小米智能硬件产品大众化普及,让更多用户享受到小米全场景智能化体验,加速「人车家全生态」战略全面展开。站长网2024-05-13 10:26:440000