阿里云推出第八代企业级实例g8i AI推理性能提升7倍
阿里云推出了第八代企业级通用计算实例 ECS g8i,采用了阿里云自研的「飞天 CIPU」架构体系和第五代英特尔至强可扩展处理器。新款实例的整机性能最高提升85%,AI 推理性能最高提升7倍,可以支持高达72B 参数的大语言模型。此外,ECS g8i 实例还提供了端到端的安全防护,为企业构建可信的 AI 应用提供了强大的隐私增强算力支持。
在通用算力方面,ECS g8i 实例的 L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%。存储方面,ESSD 云盘提供100万 IOPS,全面搭载 NVMe,存储延迟低至百微秒。网络方面,PPS 高达3000万,标配阿里云自研 eRDMA 大规模加速能力,时延低至8微秒。安全方面,ECS g8i 实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机 TDX 技术,构建了全面的安全防护。
对于 AI 应用来说,ECS g8i 实例采用了 Intel AMX 高级矩阵扩展加速技术,将生成式 AI 的运行速度提升了7倍,可以更快地运行知识检索、问答系统和摘要生成等任务。配合阿里云 Spot 抢占式实例,成本优势将进一步凸显,降低推理成本。此外,基于自研 eRDMA 超低延时弹性网络,ECS g8i 实例集群可以支持高达72B 参数的大语言模型分布式推理,推理性能随集群规模接近线性加速,并且支持超过32batchsize 的超大参数规模的 AI 模型负载。
在安全方面,阿里云通过硬件可信根和虚拟可信能力 vTPM,实现了服务器的可信启动和实例启动过程核心组件的校验能力。此次升级的 ECS g8i 实例全量支持 Trust Domain Extension TDX 技术,为大模型等 AI 应用提供了隐私增强算力。
阿里云表示,ECS g8i 实例的强劲表现证明了以 CPU 为中心的计算体系同样具备加速 AI 推理的潜力,公共云不仅可以胜任超大规模的 AI 模型,还为 AI 应用加速落地提供了新的路径。
芝加哥大学研究人员推出3D画笔:使用文本生成局部风格化纹理的AI方法
**划重点:**1.🌐3D画笔通过文本描述自动为网格上的局部语义区域着色,实现了直接在网格上进行纹理编辑的目的。2.🤖研究团队采用级联分数蒸馏(CSD)和神经场来提高局部纹理区域的细节和分辨率。3.🚀该方法使用在3D表面上定义的多层感知器,创建产生在3D中平滑变化的神经纹理,减少了纹理的噪点,并具有超分辨率能力。站长网2023-11-27 10:27:530000谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别
划重点:⭐谷歌AI发布MathWriting数据集,为在线手写数学表达提供230k人工编写和400k合成样本,成为ME识别新标杆⭐MathWriting数据集比CROHME23具有更多样本和标签,包括广泛的数学符号和语法标记⭐MathWriting支持训练模型、评估性能,并提供未来发展方向的参考站长网2024-04-24 14:12:340000京东物流001号员工退休:工作16年 刘强东兑现买房承诺
金宜财是京东物流001号员工,近日正式完成了退休。这一消息得到了他本人的证实。金宜财于2008年加入京东物流,一干就是16年。他的付出和努力得到了丰厚的回报,刘强东曾承诺,只要他干满5年,就为他购买一套房子。如今,他不仅拥有了自己的房子,还有了车子,在大城市安家落户。0001微博年度报告发布!快来评估你的微博社交人格
微博发布年度报告,这份报告中,你分享的快乐记忆、最亲密的好友、最爱的超话等都得到了呈现。通过这份报告,你可以重新审视过去的一年,并了解自己在社交媒体上的特点和偏好。同时,报告最后的微博社交人格评估也将帮助你更好地了解自己的社交行为和偏好。财报显示,截至三季度末,微博月活跃用户达到6.05亿,同比净增约2100万,日活跃用户达到2.6亿,同比净增约800万。站长网2023-12-21 16:20:300000百度将大型语言模型ERNIE应用于汽车,实现文字转图像功能
互联网大厂百度已经实现了将其大型语言模型ERNIE应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者ECARX展开合作。百度表示,他们已经进行了多次成功的实际测试,利用ERNIE的能力进行车内交互,并在量产车平台上验证了多项创新功能。这些功能包括旅程规划、车辆咨询、知识问答和创意绘画等。创意绘画是一款用于娱乐儿童并生成有用图片的文字转图像应用。站长网2023-08-03 11:23:560000