阿里魔搭社区开源推理引擎 DashInfer
站长网2024-05-24 11:42:070阅
ModelScope 推出了预训练大语言模型(LLM)推理引擎 DashInfer,支持 C 和 Python 语言接口,可在多种 CPU 架构上高效推理大模型。
DashInfer 采用 C Runtime 编写,支持连续批处理和多 NUMA 推理,能充分利用服务器级 CPU 的算力,为推理14B 及以下的 LLM 模型提供更多硬件选择。该引擎已开源,提供轻量级架构,高精度实现,优化的计算 Kernel,以及行业标准 LLM 推理技术。DashInfer 支持主流 LLM 开源模型和 PTQ 量化技术。
此外,引擎还提供多语言 API 接口,支持多种硬件和数据类型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等数据类型。关于模型支持,DashInfer 可以加载和序列化模型,执行推理过程,并采用 DLPack 格式的 tensor 与外部框架交互。在单 NUMA 架构下,推理引擎使用多线程和线程池进行调度;而在多 NUMA 架构下,引擎采用多进程 client-server 架构,实现 tensor parallel 的模型推理。
性能测试结果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能够有效提升大模型推理效率。
代码开源地址:
https://github.com/modelscope/dash-infer
推理体验地址:
https://www.modelscope.cn/studios/modelscope/DashInfer-Demo
0000
评论列表
共(0)条相关推荐
亚马逊开始测试 Agility 的 Digit 机器人进行仓储工作
要点:1.亚马逊开始测试Agility的Digit机器人以用于仓储工作,这是亚马逊对新兴技术的投资的一部分。Digit是一种双足机器人,可以在仓库内进行各种搬运工作,具有广阔的应用前景。2.亚马逊还与麻省理工学院(MIT)合作,研究机器人对就业的影响,这反映了自动化和机器人技术对劳动力市场的潜在挑战。站长网2023-10-19 10:05:570000自定义ChatGPT商店下周上线!大模型“App Store时刻”来啦
1月5日凌晨,OpenAI向所有自定义GPT开发者发布了一封邮件,下周将上线“自定义GPT商店”。自定义GPTs是OpenAI在去年首届开发者大会上发布的重磅产品,用户无需任何代码,全程支持可视化点击操作。用户只需要提交对话指令、额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能,就能快速开发法律、金融、医疗等特定领域的ChatGPT助手。000226.19万的特斯拉model Y,续航545km,带着满满诚意啊
特斯拉22款改款后轮驱动版目前最低售价26.19万,这个价格可以说很让人心动啊,那么配置方面到底如何呢?一起往下看。首先一入眼帘的就是它的外观,整体风格时尚又运动,从侧面看上去整个车身低趴显得新潮又大气,整体线条流畅又灵动,前面采用了封闭式前进气格栅,简约而不失格调。尾部圆润大方,给整个车提升了被辨识度。站长网2023-05-25 00:38:02000031款App侵害用户权益被通报 包括闲鱼、高德地图等
今日,工信部发布了《关于侵害用户权益行为的APP(SDK)通报(2024年第1批,总第36批)》指出,近期,组织第三方检测机构对用户反映突出的开屏弹窗“乱跳转”、“关不掉”以及违规收集使用个人信息等问题进行检查,共发现31款APP及SDK存在侵害用户权益行为。上述APP及SDK应按有关规定进行整改,整改落实不到位的,我部将依法依规组织开展相关处置工作。站长网2024-01-22 17:40:200000三星Galaxy S24系列中国新品发布会今晚举行 国行价格即将公布
今晚(1月25日)19:00,三星将在中国举行GalaxyS24系列新品发布会,正式公布新机的国行价格。此前,三星已在海外发布了GalaxyS24系列手机,而国行的先行者价格也已经公布。GalaxyS24系列包括GalaxyS24、GalaxyS24和GalaxyS24Ultra三款机型。站长网2024-01-25 17:14:180000