首页站长资讯Intel首批通过AISBench大模型性能测试！5代至强可达每秒2493 token

Intel首批通过AISBench大模型性能测试！5代至强可达每秒2493 token

站长网2024-09-08 09:52:580阅

快科技9月5日消息，近日，第五代英特尔至强处理器，以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试（AISBench）。

借此，英特尔也成为首批通过AISBench大语言模型（LLM）推理性能测试的企业。

在AISBench 2.0测试工具的评估下，第五代英特尔至强处理器在ChatGLM V2-6B（60亿参数）和Llama2-13B（130亿参数）两个模型上均展现了卓越的性能，能够满足轻量级大语言模型的实时推理要求。

测试结果显示，在60亿参数的ChatGLM V2模型通用推理中，当输入输出序列为256时，处理器可达每秒2493 token的性能；当输入输出序列为2048时，性能为每秒926 token。

在130亿参数的Llama2模型通用推理中，当输入输出为256时，性能为每秒513 token；当输入输出序列为2048时，性能为每秒132 token。

AISBench 2.0的测试结果，验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能。

也使得客户可以通过基于至强的服务器，构建一个通用AI系统进行数据预处理、模型推理和部署，从而获得兼具AI性能、效率、准确性和可扩展性的组合。

同时还彰显了英特尔至强可以为企业提供开箱即用”的功能，即可以在通用系统上部署一部分AI工作负载，从而为客户带来更佳的总体拥有成本（TCO）优势。

Intel首批通过AISBench大模型性能测试5代至强可达每秒2493token

0000

评论列表

共(0)条

相关推荐

站长资讯
智谱AI发布MathGLM数学模型算术任务性能优于GPT-4
近日，智谱AI发布MathGLM数学模型，旨在增强大模型在数学推理方面的性能。它能够精确计算算术运算，包括基础算术运算和复杂混合运算，并提升模型的中文数学解决能力。研究表明，20亿参数的MathGLM模型在算术任务上表现出卓越的性能，准确率几乎可以达到100%，优于GPT-4。
站长网2023-09-25 08:44:02
0000
站长资讯
把“全世界”搬进直播间，我在淘宝做跨境电商直播
全球达人们正涌入淘宝直播。刚刚过去的这届618大促期间，全网百万粉丝的探店达人“锁哥在日本”把日语小课堂搬到了淘宝直播，边教日语边带货;日本女团成员“小小葵呀”用宅舞开启直播首秀;全网粉丝百万的“泰国阿芳夫妇”入淘直播首秀则吸引了近百万粉丝围观。在这个疫情放开后的首个大促，全球达人们通过直播架起进口消费的重要桥梁，让消费者积压了三年的跨境购物需求得以释放。
站长网2023-07-05 19:41:39
0002
站长资讯
Meta发布全新AI自动剪辑视频工具Agents LAVE
要点:1、AgentsLAVE结合AI技术，可以自动生成简单短视频和广告视频，实现无需人工干预的视频剪辑过程。2、剪辑工具界面包括输入提示、素材库和视频时间轴，而Agents设计则指导编辑行动计划的执行。3、Agents支持五种LLM功能，包括素材概览、创意头脑风暴、视频检索、故事板和剪辑修剪，实现自动生成的语言构建视频编辑。
站长网2024-02-19 16:03:35
000111
站长资讯
小红书真开始发力自己的私域了
最近在小红书上看到了一个很有意思的功能，有伙伴提到这是在新版本后新增的功能。当看到好玩的评论时，不光可以分享给小红书内的好友，还可以将评论分享给微信好友。点击“分享到微信”，会自动生成一张带有评论的图片。过去，在分享小红书帖子时仅能够生成一张链接卡片，卡片上只能看到帖子标题和小部分文字内容，没办法再展示更多。对比来看，能够发现小红书在分享上就设置了自己的“小心机”。
站长网2024-07-06 16:14:58
0000
站长资讯
谷歌将于 12 月 1 日开始删除不活跃的 Gmail 帐户
据PCMag的报道，谷歌计划于12月1日起删除不活跃的Gmail帐户和照片。非活跃帐户被定义为两年内未使用的帐户，包括未登录、未发送或阅读邮件、未使用云端硬盘、未观看YouTube视频、未分享照片、未下载应用程序以及未进行登录时搜索活动。
站长网2023-11-13 21:42:38
0000