智源发布FlagAttention算子集 适配多种大模型训练芯片
站长网2023-12-08 15:01:411阅
为了满足大模型对计算资源的需求,智源研究院开发了 FlagAttention 项目,旨在构建一套适配多种芯片的大模型核心算子集合。
该项目选择使用 Triton 作为开发语言,通过 Triton 的开放性和易用性,使得 FlagAttention 不仅支持 NVIDIA GPU,还可以显著降低不同芯片之间模型适配的成本,提高大模型的训练与推理效率。
FlagAttention 目前包含两个算子:piecewise_attention 和 flash_attention。
其中,piecewise_attention 是针对长文本模型的分段式 Attention 算子,而 flash_attention 是基于 Triton 的高效 Multihead Attention 实现。
通过 FlagAttention,希望能够消除现有 AI 生态中的软件壁垒,让更广泛的模型用户能够使用到最新的模型优化技术。
未来,FlagAttention 还将支持更多功能,并与其他芯片厂商合作,优化算子的性能和适配。
项目地址:
https://github.com/FlagOpen/FlagAttention
https://github.com/FlagOpen/FlagAttention/issues
0001
评论列表
共(0)条相关推荐
2.5万起!苹果Vision Pro头显开启预订:国内代购价高达7万
快科技1月20日消息,昨晚9点,苹果VisionPro正式在美国地区开启预售。提供256GB、512GB和1TB三种版本,售价分别是3499美元(约合人民币2.5万元)、3699美元(约合人民币2.66万元)、3899美元(约合人民币2.8万元)。虽然起售价达到2.5万元,但依然被大规模抢购,毕竟这是苹果一款全新产品线,并且号称未来要取代iPhone。站长网2024-01-20 10:36:000000“多巴胺穿搭”带动涨粉44万,小红书博主越玩越花
小红书五月涨粉榜已出,我们先来看榜:本月,穿搭博主@白昼小熊强势崛起,凭借五颜六色的“多巴胺穿搭”风格火遍全网,为2023年的夏天添上了一抹亮色,以43.75W的涨幅,登顶五月涨粉榜。排名第二的是近来因直播疯狂吸粉的演员@董洁,单月涨粉数达28.99W。位列第三的是演员@是孙珍妮,继上月人气爆发后,本月依然维持了不错的涨粉势头,单月吸粉27.45W。图源:@是孙珍妮小红书截图站长网2023-06-13 14:07:580002改变传统造车思路 支持用户DIY!曝小米第三款车是增程SUV 官方曾辟谣对标理想
快科技7月9日消息,小米第二款车型尚未落定,第三款车型就登上热搜了。今日,话题#小米第三款车是增程SUV#在微博上引发热议。据报道,小米汽车规划的第三款车为增程SUV车型,主打家用,将在2026年上市。站长网2024-07-09 17:20:350000一张“纸片”卖4万,这门暴利生意,崩了?
近几年,一种“小纸片”在追星族中流行,其中稀缺款甚至可卖出数万元一张的高价,圈内人一般将其称之为“小卡”。所谓“小卡”,原本是韩国娱乐公司在推出专辑时随专附赠的印有艺人照片的卡片,一般约为3寸照片大小、硬卡质地,本质上是一种音乐专辑周边。0000YouTube 测试新的 AI 驱动聊天机器人「YouChat」以增强观看体验
YouTube正在测试一款新的人工智能聊天机器人,能够与观众交谈,让他们「更深入地了解他们正在观看的内容。」YouTube宣布,这个新的交流工具将提供「对你正在观看的视频的问题的回答,相关内容的推荐等,所有这些都不会中断播放。」这项名为「YouChat」的功能从周一起对「一小部分视频上的少数人」开放。在接下来的几周内,它将向美国的YouTubePremium成员推出,适用于安卓设备。站长网2023-11-07 10:12:100000