MLC 项目使得 AMD GPU 在 LLM 推理方面具有竞争力

站长网2023-08-11 17:43:130阅

站长之家(ChinaZ.com) 8月11日消息:AMD GPU 通过 MLC（Machine learning compilation）项目在编译和部署大模型方面取得了进展，实现了与英伟达 GPU 相当的性能。MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的 80%，而价格只有 RTX 4090 的 60%。

MLC-LLM 可以编译 LLM 并将其部署在使用具有竞争性能的 ROCm 的 AMD GPU 上。更具体地说，对于 Llama2-7B/13B，AMD Radeon™ RX 7900 XTX 的速度是 NVIDIA® GeForce RTX™ 4090 的 80%，是 NVIDIA® GeForce RTX™ 3090Ti 的 94%。除了 ROCm 之外，Vulkan 支持还允许我们将 LLM 部署推广到其他 AMD 设备，例如具有 AMD APU 的 SteamDeck。

机器学习编译（MLC）是一种新兴技术，用于编译和自动优化机器学习工作负载。与为每个独立的后端（如 ROCm 或 CUDA）编写特定的内核不同，MLC 解决方案会自动生成适用于不同后端的代码。利用基于 ML 编译的解决方案 MLC-LLM，为 LLMs 提供高性能的通用部署。MLC-LLM 建立在 Apache TVM Unity 之上，它是一种机器学习编译栈，提供了基于 Python 的开发和通用部署。MLC-LLM 为各种后端（包括 CUDA、Metal、ROCm、Vulkan 和 OpenCL）提供了最先进的性能，涵盖了服务器级 GPU 到移动设备（iPhone 和 Android）。

在较高的层次上，该框架允许用户采用基于 Python 的工作流程，包括转换计算图的 API，优化 GPU 内核的布局和调度，并将其在感兴趣的平台上进行本地部署。

MLC项目使得AMDGPU在 LLM推理方面具有竞争力

0000

评论列表

共(0)条

相关推荐

站长资讯
14亿人养不起中国电网，是因为电费价格低？美国一度电0.9元
根据2022年前三季的财报显示，国家电网和南方电网累计负债超3万亿元，反观美国，2022年第一季度的归母净利润就达到了49.2亿元，在中国14亿人用电的情况下都不盈利，难道是因为我国电费价格低造成的吗，我们缴的电费又都去哪里了呢？
站长网2023-04-14 17:09:45
0000
站长资讯
一款国民游戏，和中国游戏行业的八年
最近葡萄君总是会时不时感慨，游戏行业真的太年轻了。如果只谈国内，大概就三四十年的时间。更不用说，国产游戏逐渐摆脱大众的偏见和误解，真正成为一个主流行业，产值突飞猛进，其实也就是步入移动端时代后的这近十年。这段时间里诞生过很多爆款手游，畅销榜上随时可能出现有趣的画面，直到2015年《王者荣耀》的诞生。我们总说没有人能永立潮头，但它似乎就是那个唯一的例外。
站长网2023-11-05 10:03:44
0000
站长资讯
IMF 国际货币基金组织官员警告：人工智能可能会「严重破坏」就业市场
IMF高级官员警告称，生成式人工智能可能对劳动力市场造成「重大的干扰」，并呼吁决策者迅速制定规则来管理这项新技术。国际货币基金组织（IMF）副总裁GitaGopinath特在接受《金融时报》采访时表示，基于ChatGPT等大型语言模型的人工智能突破可能提高生产力和经济产出，但她警告称风险「非常大」。
站长网2023-06-07 19:12:17
0000
站长资讯
腾讯音乐第一季度营收67.7亿元在线音乐付费用户达1.135亿
腾讯音乐娱乐集团在港交所发布了2024年第一季度的财务报告。报告显示，该季度公司实现营收67.7亿元，较上年同期的70亿元略有下滑。然而，经过调整后的净利润达到了18.1亿元，同比增长了23.9%，显示出公司盈利能力的稳步提升。
站长网2024-05-13 17:36:55
0000
站长资讯
小米宣布Xiaomi Vela 面向全球软硬件开发者正式开源
在2023年小米IoT生态伙伴大会上，小米集团的高级副总裁、手机部总裁曾学忠宣布了一项重大消息:小米自研的系统Vela正式向全球软硬件开发者开源。小米Vela的开源对于开发者来说具有很大的吸引力。首先，它支持丰富的组件和易用的框架，能够帮助开发者更高效地开发物联网应用。其次，由于小米Vela对POSIX接口的兼容，Linux平台上的现有开源库和组件可以轻松地移植到小米Vela上。
站长网2023-11-16 11:01:51
0000