魔搭社区与vLLM和FastChat展开合作 提供高效LLM推理和部署服务
站长网2023-12-29 08:52:464阅
最近,魔搭社区与 vLLM 和 FastChat 展开合作,联合为中国开发者提供更快更高效的 LLM 推理和部署服务。开发者可以使用 vLLM 作为 FastChat 中的推理引擎,提供高吞吐量的模型推理。
FastChat 是一个开放平台,用于训练、服务和评估基于 LLM 的 ChatBot。它具有优秀的大语言模型训练和评估代码,并且具有 Web UI 和 OpenAI 兼容的 RESTful API 的分布式多模型服务系统。
vLLM 是一个由加州伯克利分校、斯坦福大学和加州大学圣迭戈分校的研究人员开发的 LLM 服务系统。它基于操作系统中经典的虚拟缓存和分页技术,实现了几乎零浪费的 KV 缓存,并且可以在请求内部和请求之间灵活共享 KV 高速缓存,从而减少内存使用量。
通过 FastChat 和 vLLM,开发者可以快速加载魔搭的模型进行推理。可以使用 FastChat 发布 model worker (s),并通过命令行客户端或网页端 WebUI 进行问答。还可以结合 FastChat 和 vLLM 搭建一个网页 Demo 或者类 OpenAI API 服务器。
FastChat开源链接:
https://github.com/lm-sys/FastChat
vLLM开源链接:
https://github.com/vllm-project/vllm
新鲜AI产品点击了解:https://top.aibase.com/
0004
评论列表
共(0)条相关推荐
OpenAI CEO亲自示范!自定义指令上手攻略,调教专属定制化AI助手
【新智元导读】OpenAI推出了ChatGPT的自定义指令功能后,似乎没有收到用户们的热情回应,Altman本人都下场亲自教大家使用。小编也来实测一波,希望给大家一些启发。可能是感觉到刚推出的自定义指令(CustomInstructions)功能没有引起太多的讨论,Altman亲自发推来指导大家该怎么用。站长网2023-08-01 16:52:210003涨价,是大厂给共享单车亮出的一张“黄牌”
降本增效的大刀紧随其后。以前骑一次一块钱、五毛钱甚至不要钱的共享单车,现在要多少钱?对于部分城市的用户而言,新的收费标准是:每小时六块五。2023年以来,主要共享单车品牌相继在成都、厦门等城市调价。有用户抱怨,如今的共享单车价格已贵过公交,直追地铁。去年上半年,共享单车企业已经历过一轮涨价潮。那轮涨价过后,不购买套餐卡情况下,部分城市共享单车价格已高达6.5元1小时。站长网2023-06-12 23:35:280000Google 升级 Gmail 人工智能垃圾邮件过滤器:RETVec 现能有效识别并处理「对抗性文本操纵」
站长之家(ChinaZ.com)12月5日消息:Google在其安全博客上宣布,Gmail的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为RETVec(Resilient&EfficientTextVectorizer,弹性高效文本向量化器)的新文本分类系统上。0000CHOIS:基于语言引导的合成逼真3D人机交互的AI方法
**划重点:**1.🌐CHOIS是由斯坦福大学与FAIRMeta研究团队开发的AI系统,通过语言描述、初始状态和稀疏对象航点,实现了在3D场景中生成对象和人物同步运动的突破性方法。2.🚶♂️与先前集中于手部运动合成的方法不同,CHOIS关注在对象抓取之前的全身运动,并根据人体运动预测对象运动,为交互式3D场景模拟提供全面解决方案。站长网2023-12-11 10:48:510000Google Photos推出AI功能,智能整理照片,分类更便捷
站长网2023-11-16 11:36:510001