Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token
站长网2024-09-08 09:52:580阅
快科技9月5日消息,近日,第五代英特尔至强处理器,以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。
借此,英特尔也成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。
在AISBench 2.0测试工具的评估下,第五代英特尔至强处理器在ChatGLM V2-6B(60亿参数)和Llama2-13B(130亿参数)两个模型上均展现了卓越的性能,能够满足轻量级大语言模型的实时推理要求。
测试结果显示,在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时,处理器可达每秒2493 token的性能;当输入输出序列为2048时,性能为每秒926 token。
在130亿参数的Llama2模型通用推理中,当输入输出为256时,性能为每秒513 token;当输入输出序列为2048时,性能为每秒132 token。
AISBench 2.0的测试结果,验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能。
也使得客户可以通过基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。
同时还彰显了英特尔至强可以为企业提供开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。
0000
评论列表
共(0)条相关推荐
正在变热的短剧出海,会成为“下一个网文”产业吗?
短剧,这两年火得很,在国内甚至带动了先入局的快手的各项数据增长,从用户数据到电商和广告的商业化表现。而放宽到整个行业,2022年上半年,微短剧备案数暴涨至2800部(《2023中国网络视听发展研究报告》数据)。站长网2023-05-19 13:58:590001老匡:抖音、小红书、B站上,教人搞钱的视频,到底能不能搞到钱?
在6月27日的文章《老匡:抖音、小红书、B站上,那些教人搞钱的视频,到底是真是假?》里,老匡给大家梳理了正在抖音、小红书、B站爆火的,9种教人搞钱的视频项目,如下:■剪映制作中视频,3天收益4000;■爱奇艺发二创视频月入3万;■美团开“美妆线上店”月销500万;■做TikTok跨境电商月入7万;■开线上花店,月入1万;■淘宝无人直播,每月营收11万;■推广短剧单个视频收益1000;站长网2023-08-08 16:20:290000金融分析多模态LLM FinTral:基于Mistral-7B模型 得分接近GPT-4
划重点:1.💡金融NLP领域的创新:FinTral采用多模态方法,处理文本、数字、表格和视觉数据,通过FinSet数据集展现卓越性能,超越GPT-4等模型。2.🌐模型特色:使用Mistral-7b模型为基础,经过领域特定的预训练、指导调整和AI反馈,结合视觉数据处理和工具检索,实现在金融分析中的精准和深度。站长网2024-02-29 11:32:420000昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色,而且还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。Skywork-MoE模型特点:开源和免费商用:Skywork-MoE的模型权重、技术报告完全开源,且免费商用,无需申请。站长网2024-06-04 14:53:4300002024福布斯中国杰出商界女性:孟晚舟跃居第二
《福布斯中国杰出商界女性100》是福布斯中国每年发布的榜单,旨在关注女性在商业领域的表现。今年榜单着重关注女性在商业竞争中的角色转换和认知,展示女性领导者的独特魅力与智慧。今年上榜者平均年龄51岁,包括创业者、职业经理人和女性二代接班人。覆盖行业包括科技、大消费等。在职业背景方面,44%的上榜者是白手起家的创业者或早期加入创始团队的成员,44%是职业经理人,而12%则是女性二代接班人。站长网2024-03-08 10:37:410000