阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。
针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。
随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。
阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。
通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。
ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。
为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。
比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。
在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。
此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。
在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。
零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。
小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

华纳音乐集团再投2亿 裁员10%削减成本
据国外媒体报道,华纳音乐集团上周三公布2022年第四季度财报,收入和利润均创新高,却也宣布将裁员约600人,相当于总员工的10%。这是该公司全新十年战略规划的一部分。季度收入同比增长17%至17.5亿美元,正常化后业绩同比增11%。财报会议上,首席执行官罗伯特·金克尔透露,裁员措施旨在节省约2亿美元的成本开支,这笔资金将用于再投资进入音乐行业的创新发展。0000小米双11今晚8点开启:手机产品最高优惠1000元
小米公司今日宣布,“小米双11科技狂欢季”将于今日晚上8点正式拉开帷幕。这场为期数周的购物盛典将推出多达50款新品,其中手机产品的最高优惠将达到1000元,而部分单品的特惠幅度更是高达3000元。0000人工智能进入财务领域 最大的障碍仍是传统的 Excel
站长之家(ChinaZ.com)4月20日消息:对于那些风险规避型的会计师和首席财务官来说,改变是很难的。但是,随着人工智能和其他先进技术的出现,那些适应不了的财务官可能会发现自己越来越落后于时代。站长网2023-04-20 18:01:580000微信、微博、抖音等100万粉丝以上自媒体将对外实名
昨日晚间,微信、微博、抖音、快手、百度、B站、知乎、小红书等同时发布公告,要求头部自媒体账号进行前台实名展示。上述平台表示,将分批次分阶段引导“粉丝”量50万以上的“自媒体”账号对外展示实名信息,近期将首先引导100万“粉丝”以上的“自媒体”账号对外展示实名信息。据悉,7月10日,网信办发布《关于加强“自媒体”管理的通知》称,要求强化“自媒体”的资质认证展示。站长网2023-11-01 08:19:0600008个月狂赚4亿,平价餐饮卷出百亿上市巨头
资本市场久违的迎来一家连锁餐饮企业。12月20日,小菜园正式在港交所主板挂牌上市,开盘报9.00港元/股,涨5.88%。截至收盘,股价报9.66港元/股,涨幅为14%,总市值为114亿港元。相比于连锁率较高的川菜、湘菜、粤菜等菜系,小菜园主打的是徽菜菜系,价格位于50元~100元的平价餐饮,目前门店规模640余家,皆是直营模式。0000