Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B
划重点:
1. 🌐 StripedHyena-7B引领人工智能领域,提供计算效率和性能升级的替代选择。
2. 🚀 采用独特混合结构,StripedHyena在训练、微调和生成长序列时表现出色。
3. 💡 未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。
Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B(SH7B),同时还推出了聊天模型StripedHyena-Nous-7B(SH-N7B)。StripedHyena基于上一年创建的一系列有效的序列建模架构(如H3、Hyena、HyenaDNA和Monarch Mixer)的重要经验教训。

研究人员强调,StripedHyena在训练、微调和生成长序列过程中处理效率更高,具备更快的速度和更高的内存效率。通过采用独特的混合技术,StripedHyena将门控卷积和注意力结合成了所谓的Hyena运算符。在短序列任务中,包括OpenLLM排行榜任务,StripedHyena在性能上超越了Llama-27B、Yi7B以及最强大的Transformer替代品,如RWKV14B。


该模型在处理短序列任务和处理长提示的各种基准测试中都进行了评估。通过对Project Gutenberg书籍进行的困惑度缩放实验显示,困惑度在32k处饱和,或在此点以下减少,表明该模型能够从更长的提示中吸收信息。
StripedHyena通过将注意力和门控卷积组合成Hyena运算符的独特混合结构实现了高效性。研究人员采用创新的嫁接技术对这种混合设计进行了优化,使其在训练过程中能够进行体系结构修改。
研究人员强调StripedHyena的关键优势之一是其在训练、微调和生成长序列等各种任务中的提速和内存效率。在端到端训练的32k、64k和128k行上,StripedHyena相对于优化的Transformer基线(使用FlashAttention v2和自定义内核)分别提高了30%、50%和100%。
未来,研究人员希望在StripedHyena模型的多个领域取得重大进展。他们计划构建更大的模型,以处理更长的上下文,拓展信息理解的界限。此外,他们计划引入多模态支持,通过允许模型处理和理解来自文本和图像等各种来源的数据,提高模型的适应性。
StripedHyena模型有望通过引入额外的计算(例如在门控卷积中使用多个头部)在性能上超越Transformer模型。这种受线性注意力启发的方法在H3和MultiHyena等架构中被证明在训练期间提高模型质量,并为推断效率提供优势。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。
项目网址:https://huggingface.co/togethercomputer/StripedHyena-Hessian-7B
博客:https://www.together.ai/blog/stripedhyena-7b
微软 Windows 11 即将改变沿用数十年古老的截图方式
微软即将改变其操作系统中最古老的屏幕截图方法之一。即将到来的Windows11功能更新将改变当你按下PrintScreen键时发生的事情,这是屏幕截图或将显示器的内容发送到剪贴板(在基于GUI的系统之前,按PrintScreen键将复制显示器上的内容并发送到标准打印端口)。站长网2023-04-13 17:45:110000苹果WWDC发布AI新功能 或将推动iPhone等产品换机潮
据摩根大通分析师SamikChatterjee预测,苹果在本周WWDC大会上发布的一系列AI辅助功能,有望显著提升iPhone等设备的换机周期。这位分析师认为,苹果的演讲"满足了所有条件",让投资者相信其能通过AI功能拉开iPhone16乃至后续机型与iPhone15的差距。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-06-06 16:15:030000Midjourney重大升级,网页版正式上线!生成图像真实清晰
就在昨天,AI图像Midjourney进行了一波重大升级,计划将其服务完全迁移到浏览器上!这次更新的主要目的是为了提升用户体验,使用户能够轻松地享受更多的服务。全新的Midjourne网站的第一版已经正式上线。用户可以根据需求使用图像搜索和提示的功能。从此,被Midjourney用户不用再忍受Discord那样迷宫一般的用户界面,能够专心享受Midjourney生成的高质量图片。站长网2023-10-29 10:15:270000滴滴致歉补偿券领不了上热搜 官方回应:参与人数较多建议耐心等待
针对“补偿券领不到”的情况,滴滴出行App在线客服回应称:“目前参与人数较多,建议您耐心等待。”今日,针对11月27日夜间发生系统故障的情况,滴滴表示,将于未来24小时内完成结算,乘客如有多支付的情况将退回多收部分。同时,滴滴还表示,为所有用户准备了1张10元打车立减券用于致歉补偿。站长网2023-11-29 15:59:550000微信支付App Store再次提供充值优惠 新用户优惠10%
根据网友透露,微信支付近日在苹果AppStore再次提供充值优惠,活动时间为9月22日至9月28日。据活动网页介绍,新用户可享受10%的充值优惠,非新用户则可享受5%的充值优惠。同时,充值后分享好友可以获得价值25元的充值礼包以及随机游戏彩蛋礼包。需要注意的是,这个活动的名额有限,先到先得。站长网2023-09-24 09:47:330000