Buddy Compiler打通LLaMA 2端到端推理
要点:
LLaMA2端到端推理打通!结合 MLIR 和 PyTorch 的编译生态,中国团队展示了 Buddy Compiler 的前端部分实现,可以覆盖 LLaMA 计算图,进行 MLIR 转换和部分优化。
Buddy Compiler 基于 PyTorch 和 MLIR 实现了 LLaMA 的端到端推理通路,通过 Buddy Compiler 工具链进行优化和下降,最终生成可执行文件,实现了从 AI 模型到硬件架构的编译流程。
技术路线标准化、上手门槛低和优化上限高是整个软硬件协同设计生态的重要原则,Buddy Compiler 致力于实现这一目标,并将 PyTorch 和 MLIR 作为关键组成部分,提供了简化和解耦的开发流程。
Buddy Compiler 选择使用 TorchDynamo 作为 Trace 工具对接 AI 模型,并使用 Aten IR 作为对接层级,通过 MLIR Python Bindings 实现 Dynamo Compiler 生成 TOSA/Linalg Ops,从而实现了从 PyTorch 到 MLIR 的转换。
Buddy Compiler 是一个结合了 MLIR 和 PyTorch 的编译生态的工具,它实现了 LLaMA 的端到端推理通路。通过 Buddy Compiler,我们可以将 AI 模型从 PyTorch 转换为 MLIR,并进行优化和下降,最终生成可执行文件。
Buddy Compiler 的设计原则是技术路线标准化、上手门槛低和优化上限高。为了实现这一目标,Buddy Compiler 选择使用 TorchDynamo 作为 Trace 工具对接 AI 模型,并使用 Aten IR 作为对接层级。通过 MLIR Python Bindings 实现的 Dynamo Compiler 可以将 PyTorch 的 Aten IR 转换为 MLIR 的 TOSA/Linalg Ops。
Buddy Compiler 的编译通路可以面向通用硬件进行优化。它使用了 MLIR Core Dialect 进行实现,从而实现了最大化的复用,并且与所有 LLVM/MLIR 的工具兼容。在优化方面,Buddy Compiler 采用了针对循环的并行计算优化和针对矩阵乘法的向量化优化。
它还可以生成面向特定加速器的代码,例如 Gemmini 加速器。目前,Buddy Compiler 已经在 X86AVX512平台上进行了测试,同时还在进行 Arm Neon 和 RISC-V Vector Extesion 的广泛测试。未来,Buddy Compiler 还计划支持 GPU 的优化,并增加前端的覆盖程度,以及将多模态大模型编译到多种硬件平台上。
总的来说,Buddy Compiler 通过结合 MLIR 和 PyTorch 的编译生态,实现了 LLaMA 的端到端推理通路。它的设计原则是标准化技术路线、降低上手门槛和提高优化上限。通过 Buddy Compiler,我们可以将 AI 模型从 PyTorch 转换为 MLIR,并进行优化和下降。
Buddy Compiler 的编译通路可以面向通用硬件进行优化,并已在 X86AVX512平台上进行了测试。未来,Buddy Compiler 还计划支持更多的硬件平台,并增加前端的覆盖程度。通过 Buddy Compiler,我们可以更好地利用软硬件协同设计,实现高效的大模型推理。
百度和小红书夺走的,淘宝想用AI夺回来
淘宝问问可能替代淘宝搜索淘宝在搜索框里加上了AI应用——淘宝问问,它的核心目标是成为下一代的电商智能导购。相比于商业化,淘宝问问更在意如何留住更多新用户。淘宝问问的野心不止于电商,它还会在生活、消费甚至娱乐方面探索边界。如何在近9亿用户的基础上再去寻找新的增量?这是淘天CEO戴珊不得不面对的新挑战。0000Tabnine Chat测试版发布 利用生成式AI进行编程
Tabnine最近宣布了TabnineChat的测试版,可以使用自然语言与Tabnine的AI模型进行交互。这个聊天应用程序可以在IDE内部运行,只允许组织在许可的代码上进行训练,并且可以在隔离的环境中部署。这个新的聊天功能使用了Tabnine的大型语言模型,将AI助手的功能扩展到了代码生成之外,还可以解释现有的代码,搜索代码仓库,并根据自然语言的规范生成新的代码。站长网2023-08-07 11:29:520000谷歌即将发布对话式人工智能软件Gemini 挑战OpenAI的GPT-4
据报道,谷歌即将发布其对话式人工智能软件Gemini。这家科技巨头已经让一些选定的公司提前获得Gemini的早期版本,该版本旨在与OpenAI的GPT-4模型竞争。据悉,Gemini由一系列大型语言模型组成,为一系列应用程序提供支持,包括聊天机器人、文本摘要、生成电子邮件草稿和新闻报道等原始文本,以及帮助软件工程师编写代码和生成图像。站长网2023-09-15 16:06:380000B站崩了上热搜 页面显示加载失败请重试
今日早间,有部分网友反馈称,B站出现了宕机的情况,随后,“B站崩了”登上热搜。据悉,网友们表示,B站APP页面出现了“出错了,加载失败”等提示。对此,B站官方暂未回应。站长网2024-01-17 08:43:330000京东物流与菜鸟网络宣布达成合作 菜鸟全面接入京东平台
据36氪报道,近日,京东物流与菜鸟网络宣布达成合作,菜鸟网络将全面接入京东平台,为京东的商家和消费者提供全球快递和全球供应链服务。目前,双方的系统已基本完成对接,这标志着菜鸟网络的自营快递服务,包括菜鸟速递和菜鸟大件家装供应链等,都将为京东平台的商家和用户服务。0000