MLC 项目使得 AMD GPU 在 LLM 推理方面具有竞争力
站长之家(ChinaZ.com) 8月11日消息:AMD GPU 通过 MLC(Machine learning compilation)项目在编译和部署大模型方面取得了进展,实现了与英伟达 GPU 相当的性能。MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的 80%,而价格只有 RTX 4090 的 60%。
MLC-LLM 可以编译 LLM 并将其部署在使用具有竞争性能的 ROCm 的 AMD GPU 上。更具体地说,对于 Llama2-7B/13B,AMD Radeon™ RX 7900 XTX 的速度是 NVIDIA® GeForce RTX™ 4090 的 80%,是 NVIDIA® GeForce RTX™ 3090Ti 的 94%。除了 ROCm 之外,Vulkan 支持还允许我们将 LLM 部署推广到其他 AMD 设备,例如具有 AMD APU 的 SteamDeck。
机器学习编译(MLC)是一种新兴技术,用于编译和自动优化机器学习工作负载。与为每个独立的后端(如 ROCm 或 CUDA)编写特定的内核不同,MLC 解决方案会自动生成适用于不同后端的代码。利用基于 ML 编译的解决方案 MLC-LLM,为 LLMs 提供高性能的通用部署。MLC-LLM 建立在 Apache TVM Unity 之上,它是一种机器学习编译栈,提供了基于 Python 的开发和通用部署。MLC-LLM 为各种后端(包括 CUDA、Metal、ROCm、Vulkan 和 OpenCL)提供了最先进的性能,涵盖了服务器级 GPU 到移动设备(iPhone 和 Android)。
在较高的层次上,该框架允许用户采用基于 Python 的工作流程,包括转换计算图的 API,优化 GPU 内核的布局和调度,并将其在感兴趣的平台上进行本地部署。
AI技术深度加持!新版虎牙直播“看播”互动超有趣
赶在龙年春节前夕,虎牙直播悄然完成一次更新。除了UI界面焕然一新之外,这次上线的虎牙直播V12.0版本最大的亮点是对直播间体验、赛事体系进行了升级强化,同时新增社区内容与游戏服务等诸多新功能,今天也跟着小编的脚步,一起来体验下最新版虎牙直播都带来了哪些改变和惊喜吧。站长网2024-02-06 18:00:110000AI解决方案提供商「清昴智能」完成千万元天使轮融资
2023年6月,AI推理部署解决方案提供商「清昴智能」宣布完成数千万元天使轮融资,由绿洲资本独家领投,此次融资资金主要用于算法研发、产品开发和团队扩充。清昴智能成立于2022年10月,清昴智能创始团队来自于清华计算机系。清昴智能的使命是降低包括基础模型在内的AI使用和落地成本,通过针对模型的推理和部署环节进行优化来降低AI模型的使用门槛。清昴智能的愿景是让AI能够运行在任何设备上。站长网2023-06-25 23:21:350000B站新计划想激励暂无变现能力UP主
3月7日,B站发布的最新财报中称“超300万UP主在B站中获得收入”,3月18日,在财报发出不久后,B站向创作者发出激励计划,邀约暂无变现能力的中底部创作者参与计划,助力UP主起步。从用户中来,到用户中去。B站的商业化一环中离不开的是用户的共创与合作,这次放出的扶持计划似是一种二者共赢的橄榄枝。01从幼苗开始浇灌站长网2024-03-19 18:08:530001小红书在IOS端上线旁白功能
为了帮助视障用户更好地使用和融入小红书社区,该平台于今年5月初在iOS端的更新版中适配了苹果系统的“旁白”辅助功能。据介绍,视障用户在进入小红书社区、刷笔记时,旁白功能会提示每个按钮的具体功能;在搜索场景时,视障用户能够通过语音提示了解整个页面的结构,接收到双列里每一篇笔记的内容,并进入到自己感兴趣的一篇笔记中去浏览内容。站长网2023-05-22 11:35:230002