Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B
划重点:
1. 🌐 StripedHyena-7B引领人工智能领域,提供计算效率和性能升级的替代选择。
2. 🚀 采用独特混合结构,StripedHyena在训练、微调和生成长序列时表现出色。
3. 💡 未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。
Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B(SH7B),同时还推出了聊天模型StripedHyena-Nous-7B(SH-N7B)。StripedHyena基于上一年创建的一系列有效的序列建模架构(如H3、Hyena、HyenaDNA和Monarch Mixer)的重要经验教训。

研究人员强调,StripedHyena在训练、微调和生成长序列过程中处理效率更高,具备更快的速度和更高的内存效率。通过采用独特的混合技术,StripedHyena将门控卷积和注意力结合成了所谓的Hyena运算符。在短序列任务中,包括OpenLLM排行榜任务,StripedHyena在性能上超越了Llama-27B、Yi7B以及最强大的Transformer替代品,如RWKV14B。


该模型在处理短序列任务和处理长提示的各种基准测试中都进行了评估。通过对Project Gutenberg书籍进行的困惑度缩放实验显示,困惑度在32k处饱和,或在此点以下减少,表明该模型能够从更长的提示中吸收信息。
StripedHyena通过将注意力和门控卷积组合成Hyena运算符的独特混合结构实现了高效性。研究人员采用创新的嫁接技术对这种混合设计进行了优化,使其在训练过程中能够进行体系结构修改。
研究人员强调StripedHyena的关键优势之一是其在训练、微调和生成长序列等各种任务中的提速和内存效率。在端到端训练的32k、64k和128k行上,StripedHyena相对于优化的Transformer基线(使用FlashAttention v2和自定义内核)分别提高了30%、50%和100%。
未来,研究人员希望在StripedHyena模型的多个领域取得重大进展。他们计划构建更大的模型,以处理更长的上下文,拓展信息理解的界限。此外,他们计划引入多模态支持,通过允许模型处理和理解来自文本和图像等各种来源的数据,提高模型的适应性。
StripedHyena模型有望通过引入额外的计算(例如在门控卷积中使用多个头部)在性能上超越Transformer模型。这种受线性注意力启发的方法在H3和MultiHyena等架构中被证明在训练期间提高模型质量,并为推断效率提供优势。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。
项目网址:https://huggingface.co/togethercomputer/StripedHyena-Hessian-7B
博客:https://www.together.ai/blog/stripedhyena-7b
厉害了!AI无人机在比赛中打败人类冠军专业选手
文章概要:1.苏黎世大学和英特尔研发的Swift人工智能无人机,在与人类专业选手的比赛中取得了胜利。2.Swift的优势在于更快的反应时间、更高的转弯速度和更长期的规划。3.Swift使用传感器、神经网络和深度强化学习来导航现实世界和制定飞行策略。苏黎世大学和英特尔的研究人员推出了一款名为Swift的自动竞技无人机,它在无人机比赛中击败了人类专业选手。站长网2023-09-01 11:24:070000阿里巴巴:未来3年加大三大AI领域投入 将超过去10年总和
阿里巴巴加大AI投入,三大领域重点布局阿里巴巴集团CEO吴泳铭在2025财年第三季度财报会议中宣布,公司将加大对AI的投入,重点围绕三大领域展开:AI和云计算基础设施建设:提升AI和云计算的底层支撑能力。AI基础模型平台及AI原生应用:开发先进的AI基础模型和促进AI原生应用的创新。现有业务的AI转型升级:利用AI赋能现有业务,提升效率和竞争力。0000百度百家号整治自媒体乱象 打击“自媒体”违规营利行为
近日,百家号宣布开展“清朗·从严整治‘自媒体’乱象”专项行动。百家号称,将对以下三大类违规行为进行重点治理:一、坚决打击“自媒体”发布传播谣言信息、有害信息和虚假消息,平台将对发布以下几类违规内容的账号进行处罚:通过编造虚假事件、离奇故事,无中生有制造谣言;通过“标题党”炒作传播有害信息;翻炒旧闻博取关注吸引流量;其他违反平台规范的违规内容。站长网2023-05-25 10:03:070003互联网大公司:忘记江湖恩怨,回归根本
2024开春,股市不好。包括不仅限于美股、港股和大A。资本市场表现不佳,这是一个链条效应。但是,资本天然要追求流动。资产只有流动起来才能产生更大的价值,因此,2023年岁末,2024年年初,互联网巨头们也没闲着。0000选择比努力重要,在AI行业更加明显
技术只是起步的基础,商业模式才是王道。在科技与商业相互交织的历史中,我们经常会看到一些技术大咖亲自上阵,担任企业CEO的例子,从苹果的乔布斯,到Mdjourney的DavidHolz,再到OpenAI的SamAltman,都是如此。这些心怀理想,又天马行空的技术狂人,时常能用自己过人的创造力,为企业带来巨大的成就。然而,令人唏嘘的是,并非所有狂热的技术理想,最后都能造就行业佳话。站长网2023-06-30 23:54:090001