Tanuki通过自动模型蒸馏 轻松构建LLM技术驱动的应用
Tanuki.py是一个用于构建LLM(Large Language Models)驱动应用的工具库。该库旨在通过自动模型蒸馏,实现应用在使用过程中的成本和延迟的逐渐降低,最多可达到90%的成本降低和80%的延迟降低。
Tanuki的使用非常简单,用户只需使用@tanuki.patch和@tanuki.align装饰器即可将LLM引入Python函数。@tanuki.patch用于将LLM嵌入函数体,而@tanuki.align用于通过测试驱动对函数的行为进行对齐。对齐的目的是确保LLM输出与期望的输出一致,从而提高可预测性。
项目地址:https://github.com/Tanuki/tanuki.py
这个工具库的特色之一是对类型的支持。用户可以使用类型提示,如Python基本类型、Pydantic类、Literals、Generics等,确保LLM输出符合函数的类型约束,防止出现意外错误。
除了类型支持,Tanuki还提供了对RAG(Retrieval Augmented Generation)的支持,允许用户通过嵌入输出来集成下游RAG实现。这样,用户可以在降低成本和延迟的同时提高对长篇内容的性能。
在使用Tanuki构建LLM-powered函数时,用户可以通过对齐函数来验证期望的输出。这种测试驱动的对齐方法有助于确认函数是否符合预期行为,捕获行为细微差异,并支持迭代开发。
Tanuki的工作原理是在开发过程中调用tanuki-patched函数时,会使用n-shot配置的LLM生成类型化的响应。响应经过后处理,确保返回正确的类型。这些响应将作为未来训练数据存储,随着数据量的增加,将使用更小的模型进行蒸馏,从而实现更低的计算成本、更低的延迟,无需额外的MLOps努力。
Tanuki.py提供了一种简单而强大的方式,通过LLM构建应用,并通过自动模型蒸馏实现成本和性能的优化。其类型感知、RAG支持和测试驱动的对齐方法使其成为构建可靠、可预测、逐渐优化的LLM-powered应用的理想选择。
四五线城市开什么店赚钱?
各位村民好,我是村长。很多人都想回老家开店创业,但几乎都是失败的。不是不会开店,核心原因是选错了店。如果一开始把方向搞错了,不管店铺大小,投入成本如何,都会失败。所以我今天给大家一些建议,回四五线城市创业,开什么店容易成功。当然,这里所谓的成功就是让你赚个养家糊口的钱,不是暴发户。1、回县城能赚钱的10个生意2、回县城千万不能做的8个生意01卤菜店0000全能自动化工具Activepieces 集成OpenAI、Discord等80多种集成
Activepieces是一个开源的全能自动化工具,被视为流行的自动化平台Zapier的一个替代品。它提供了用户友好的工作流构建器,使用户能够轻松创建和管理自动化工作流。工作流构建器具有直观的界面,支持分支、循环和拖放功能,增加了工作流创建的灵活性和易用性。站长网2024-01-05 11:47:450002百度宣布国内首个大模型数据标注基地运营:标注师100%本科
快科技8月25日消息,据百度官方介绍,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地日前启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。官方表示,当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。0003小米Civi 4入网 首发搭载高通骁龙8s Gen 3
近日,备受关注的小米手机系列再添新成员,型号为“24053PY09C”的新机型预计将成为小米Civi4标准版,引起了市场的广泛关注。在此之前,小米Civi4的高配版本已经悄然入网,其设备名称显示为“卫星移动终端”,意味着该版本将支持卫星通信功能,为用户带来更为全面的通信体验。站长网2024-03-11 14:51:550000德勤日本最快九月开始将用 AI 审查企业财务信息
站长之家(ChinaZ.com)8月15日消息:德勤日本(DeloitteTohmatsu)最早将于九月份正式开始使用人工智能(AI)来审查公司的财务信息。通过让AI学习过去出现错误和不当行为的公司的财务报告,可以为审计目的识别合规风险。随着公司不当会计实践的增多,使用AI进行高效审计已越来越常见。站长网2023-08-15 11:01:380000