MLC 项目使得 AMD GPU 在 LLM 推理方面具有竞争力
站长之家(ChinaZ.com) 8月11日消息:AMD GPU 通过 MLC(Machine learning compilation)项目在编译和部署大模型方面取得了进展,实现了与英伟达 GPU 相当的性能。MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的 80%,而价格只有 RTX 4090 的 60%。

MLC-LLM 可以编译 LLM 并将其部署在使用具有竞争性能的 ROCm 的 AMD GPU 上。更具体地说,对于 Llama2-7B/13B,AMD Radeon™ RX 7900 XTX 的速度是 NVIDIA® GeForce RTX™ 4090 的 80%,是 NVIDIA® GeForce RTX™ 3090Ti 的 94%。除了 ROCm 之外,Vulkan 支持还允许我们将 LLM 部署推广到其他 AMD 设备,例如具有 AMD APU 的 SteamDeck。
机器学习编译(MLC)是一种新兴技术,用于编译和自动优化机器学习工作负载。与为每个独立的后端(如 ROCm 或 CUDA)编写特定的内核不同,MLC 解决方案会自动生成适用于不同后端的代码。利用基于 ML 编译的解决方案 MLC-LLM,为 LLMs 提供高性能的通用部署。MLC-LLM 建立在 Apache TVM Unity 之上,它是一种机器学习编译栈,提供了基于 Python 的开发和通用部署。MLC-LLM 为各种后端(包括 CUDA、Metal、ROCm、Vulkan 和 OpenCL)提供了最先进的性能,涵盖了服务器级 GPU 到移动设备(iPhone 和 Android)。
在较高的层次上,该框架允许用户采用基于 Python 的工作流程,包括转换计算图的 API,优化 GPU 内核的布局和调度,并将其在感兴趣的平台上进行本地部署。
14亿人养不起中国电网,是因为电费价格低?美国一度电0.9元
根据2022年前三季的财报显示,国家电网和南方电网累计负债超3万亿元,反观美国,2022年第一季度的归母净利润就达到了49.2亿元,在中国14亿人用电的情况下都不盈利,难道是因为我国电费价格低造成的吗,我们缴的电费又都去哪里了呢?站长网2023-04-14 17:09:450000一款国民游戏,和中国游戏行业的八年
最近葡萄君总是会时不时感慨,游戏行业真的太年轻了。如果只谈国内,大概就三四十年的时间。更不用说,国产游戏逐渐摆脱大众的偏见和误解,真正成为一个主流行业,产值突飞猛进,其实也就是步入移动端时代后的这近十年。这段时间里诞生过很多爆款手游,畅销榜上随时可能出现有趣的画面,直到2015年《王者荣耀》的诞生。我们总说没有人能永立潮头,但它似乎就是那个唯一的例外。站长网2023-11-05 10:03:440000IMF 国际货币基金组织官员警告:人工智能可能会「严重破坏」就业市场
IMF高级官员警告称,生成式人工智能可能对劳动力市场造成「重大的干扰」,并呼吁决策者迅速制定规则来管理这项新技术。国际货币基金组织(IMF)副总裁GitaGopinath特在接受《金融时报》采访时表示,基于ChatGPT等大型语言模型的人工智能突破可能提高生产力和经济产出,但她警告称风险「非常大」。站长网2023-06-07 19:12:170000腾讯音乐第一季度营收67.7亿元 在线音乐付费用户达1.135亿
腾讯音乐娱乐集团在港交所发布了2024年第一季度的财务报告。报告显示,该季度公司实现营收67.7亿元,较上年同期的70亿元略有下滑。然而,经过调整后的净利润达到了18.1亿元,同比增长了23.9%,显示出公司盈利能力的稳步提升。站长网2024-05-13 17:36:550000小米宣布Xiaomi Vela 面向全球软硬件开发者正式开源
在2023年小米IoT生态伙伴大会上,小米集团的高级副总裁、手机部总裁曾学忠宣布了一项重大消息:小米自研的系统Vela正式向全球软硬件开发者开源。小米Vela的开源对于开发者来说具有很大的吸引力。首先,它支持丰富的组件和易用的框架,能够帮助开发者更高效地开发物联网应用。其次,由于小米Vela对POSIX接口的兼容,Linux平台上的现有开源库和组件可以轻松地移植到小米Vela上。站长网2023-11-16 11:01:510000