Buddy Compiler打通LLaMA 2端到端推理
要点:
LLaMA2端到端推理打通!结合 MLIR 和 PyTorch 的编译生态,中国团队展示了 Buddy Compiler 的前端部分实现,可以覆盖 LLaMA 计算图,进行 MLIR 转换和部分优化。
Buddy Compiler 基于 PyTorch 和 MLIR 实现了 LLaMA 的端到端推理通路,通过 Buddy Compiler 工具链进行优化和下降,最终生成可执行文件,实现了从 AI 模型到硬件架构的编译流程。
技术路线标准化、上手门槛低和优化上限高是整个软硬件协同设计生态的重要原则,Buddy Compiler 致力于实现这一目标,并将 PyTorch 和 MLIR 作为关键组成部分,提供了简化和解耦的开发流程。
Buddy Compiler 选择使用 TorchDynamo 作为 Trace 工具对接 AI 模型,并使用 Aten IR 作为对接层级,通过 MLIR Python Bindings 实现 Dynamo Compiler 生成 TOSA/Linalg Ops,从而实现了从 PyTorch 到 MLIR 的转换。
Buddy Compiler 是一个结合了 MLIR 和 PyTorch 的编译生态的工具,它实现了 LLaMA 的端到端推理通路。通过 Buddy Compiler,我们可以将 AI 模型从 PyTorch 转换为 MLIR,并进行优化和下降,最终生成可执行文件。

Buddy Compiler 的设计原则是技术路线标准化、上手门槛低和优化上限高。为了实现这一目标,Buddy Compiler 选择使用 TorchDynamo 作为 Trace 工具对接 AI 模型,并使用 Aten IR 作为对接层级。通过 MLIR Python Bindings 实现的 Dynamo Compiler 可以将 PyTorch 的 Aten IR 转换为 MLIR 的 TOSA/Linalg Ops。
Buddy Compiler 的编译通路可以面向通用硬件进行优化。它使用了 MLIR Core Dialect 进行实现,从而实现了最大化的复用,并且与所有 LLVM/MLIR 的工具兼容。在优化方面,Buddy Compiler 采用了针对循环的并行计算优化和针对矩阵乘法的向量化优化。
它还可以生成面向特定加速器的代码,例如 Gemmini 加速器。目前,Buddy Compiler 已经在 X86AVX512平台上进行了测试,同时还在进行 Arm Neon 和 RISC-V Vector Extesion 的广泛测试。未来,Buddy Compiler 还计划支持 GPU 的优化,并增加前端的覆盖程度,以及将多模态大模型编译到多种硬件平台上。
总的来说,Buddy Compiler 通过结合 MLIR 和 PyTorch 的编译生态,实现了 LLaMA 的端到端推理通路。它的设计原则是标准化技术路线、降低上手门槛和提高优化上限。通过 Buddy Compiler,我们可以将 AI 模型从 PyTorch 转换为 MLIR,并进行优化和下降。
Buddy Compiler 的编译通路可以面向通用硬件进行优化,并已在 X86AVX512平台上进行了测试。未来,Buddy Compiler 还计划支持更多的硬件平台,并增加前端的覆盖程度。通过 Buddy Compiler,我们可以更好地利用软硬件协同设计,实现高效的大模型推理。
公安部明确严厉打击网络水军 关停违法违规账号2.1万余个
今日,公安部公布数据称,自今年4月开始,公安部开展了为期100天的网络谣言打击整治专项行动,全国公安机关共侦办案件2300余起,整治互联网平台企业近8000家(次),依法关停违法违规账号2.1万余个,清理网络谣言信息70.5万余条。公安部表示,当前“网络水军”造谣传谣违法行为,主要表现在以下三个方面:站长网2023-07-21 15:17:300000亚马逊云科技宣布全托管生成式 AI 服务Amazon Bedrock已正式可用
亚马逊云科技宣布,全托管生成式AI服务AmazonBedrock现已正式可用。客户可以使用来自众多领先AI公司的高性能基础模型,帮助各种规模的企业构建新的生成式AI应用程序。这些创新包括:1.AmazonBedrock:全面托管的生成式AI服务,提供了来自多个领先AI公司的高性能基础模型和构建应用程序所需的功能。它简化了开发过程,同时确保隐私和安全。站长网2023-10-07 14:09:460000李雪琴的老同学们,捧红了一个单月涨粉200万的抖音号
拍老同学的故事也能涨粉百万?近期,抖音账号“在下辉子”将高中毕业照放大贴在墙上,每期随机点到一位高中同学,随后赶到对方所在的城市,探访对方现在的生活。7月15日,“在下辉子”发布了老同学系列的第一期视频,主人公是高考与人大失之交臂、本硕毕业于对外经贸大学的女同学,她也是辉子的初恋对象。站长网2023-09-11 17:40:470000魅族宣布征集Flyme中文OS名称:要像鸿蒙、澎湃一样响亮
魅族科技今天宣布,他们将启动一个活动,为Flyme操作系统征集一个中文名称。这个活动从即日起到11月25日,网友可以在微博、抖音、魅族社区等平台发布带有#Flyme征集中文OS名的话题并发布自己的创作,参与命名活动的网友有机会赢取由魅族提供的“华小魅”手机组合,包含华为Mate60Pro、小米14Pro和魅族20PRO。站长网2023-11-09 11:07:580000滴滴程维:柳青升任永久合伙人 不再设总裁岗位
快科技5月19日消息,滴滴创始人、董事长兼CEO程维与滴滴联合创始人、董事兼总裁柳青联合发布内部全员信,宣布柳青升任公司永久合伙人。同时,柳青不再任董事和总裁,而在未来,滴滴公司也不再设置总裁岗位。升任永久合伙人后,柳青分管的部门和职责不变,并继续担任公司首席人才官,专注在公司人才、组织建设及社会责任工作上,并继续向董事长兼CEO程维汇报。0000