阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。
针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。
随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。
阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。
通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。
ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。
为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。
比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。
在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。
此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。
在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。
零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。
小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。
报告:ChatGPT 撰写的近期AI会议同行评审高达 17%
划重点:🔍研究发现,2023-2024年顶级AI会议的同行评审中有大量AI生成内容。🔍重度AI内容的审稿往往出现在截止日期附近。🔍人工智能对同行评审质量和完整性可能带来影响,引发了一些问题。最近的一项研究揭示了一个重要发现:2023-2024年顶级人工智能会议的同行评审中可能包含大量来自ChatGPT等模型的AI生成内容。站长网2024-03-26 14:19:200001价格的骁龙8 Gen3手机 iQOO Neo10发布:2299元起
快科技11月29日消息,今天下午,iQOONeo10正式发布。售价方面,12GB256GB售价2299元;12GB512GB售价2699元;16GB256GB售价2499元;16GB512GB售价2999元;16GB1TB售价3499元,有拉力橙、驰光白、疾影黑三款配色。0000调查显示:25%全球CEO预计生成式AI将导致2024年至少裁员5%
**划重点:**1.🌐25%的全球首席执行官预计生成式人工智能的部署将在今年至少导致5%的裁员。2.🏦媒体、银行、保险和物流行业最有可能因先进的AI工具而预测到裁员。3.💼调查显示,46%的首席执行官预计未来12个月内使用生成式AI将提高盈利能力,但47%表示该技术将带来较小或无变化。站长网2024-01-17 14:22:480000用AI整顿职场,这次打工人终于不骂钉钉了
从ChatGPT到Midjourney,从OpenAI到Office的Copilot,最近这小半年,不论是做图、写文章,甚至是做PPT、写邮件,只要是和人力创作有关的领域,我们都能够发现AIGC的浪潮汹涌,几乎每周乃至每天,AIGC领域都有新的成果。站长网2023-04-19 09:04:510001可能不是“Switch 2”!任天堂新硬件或采用全新设计
快科技5月14日,随着近日任天堂现任社长在电话会议中透露新的主机硬件已经进入开发,关于Switch2”的消息又迎来了一波新的热潮。但近日,gamesindustry发布文章,称任天堂的新硬件可能并不会沿用Switch的设计,而是会采用全新设计。gamesindustry表示,从最新的财报信息来看,任天堂需要的是一个继任者,需要一个能够带领任天堂进入全新篇章的产品。站长网2023-05-14 15:33:320000