阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。
针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。
随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。
阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。
通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。
ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。
为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。
比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。
在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。
此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。
在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。
零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。
小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。
大厂抢拍的短剧,不是稳赚不赔的生意
火了三年的短剧,依然被挖掘出了新增量。从内容质量上来看,无脑微短剧的流量红利可能在消失,但是精品化短剧的长期价值才刚刚开始。无数短剧从业者,要么离场要么探索新的内容输出。与此同时,字节、快手这些内容平台外,淘宝、京东、拼多多等电商平台,就连美团上都出现了短剧的身影,甚至360、华为、小米都跨界“短剧”,在市场上招兵买马。站长网2024-08-16 09:18:070000Airbnb研究人员开发Chronon 提高机器学习从业者生产力
Airbnb的研究人员开发了Chronon,这是一个用于开发机器学习模型的生产级特征的框架。Chronon解决了特征数据管理的挑战,实现了实时更新和训练与生产环境的一致性。站长网2023-08-09 10:54:590000雷军骑自行车上班引网友共鸣:找到我和雷军的共同点了
站长之家(ChinaZ.com)6月20日消息:今日,小米CEO雷军在社交平台分享了一段特别的日常——他选择骑自行车上班。这段视频迅速点燃了网友的讨论热情,不仅因为主角的身份特殊,更因为视频中展现的雷军与普通人相似的通勤方式。站长网2024-06-21 16:44:060002抖音:未经逝者生前同意或逝者家属授权 慎用“AI复活”技术
抖音发布《关于清明期间内容创作的提醒》称,有部分用户发布的内容不符合社区规则。平台给用户下列提醒:1、文明过节:请勿借清明节发布迷信、猎奇和有违公序良俗的内容,如配冥婚、鬼魂附体、坟头蹦迪、烧“二奶”纸扎等。2、爱护人民币:请勿发布焚烧人民币的内容。故意毁坏人民币是违法行为,可以通过其他文明、合法的方式表达对亲人的缅怀。站长网2024-04-18 15:03:300000研究人员警告:用AI生成的内容训练AI,可能会出现“模型崩溃”
随着越来越多的人使用AI来制作和发布内容,一个明显的问题出现了:当AI生成的内容在互联网上激增并且AI模型开始使用AI生成的内容进行训练,会发生什么?来自英国和加拿大的一组研究人员已经研究了这个问题,并且最近在开放获取期刊arXiv上发表了一篇相关论文。他们的发现令当前的生成式AI技术及其未来令人担忧:“我们发现在训练中使用模型生成的内容会导致生成的模型出现不可逆转的缺陷。”站长网2023-06-15 10:10:370001