AI框架LoraHub:将LoRA 模块像乐高一样组合
LoraHub 是一个 AI 框架,用于自动组合 LoRA 模块,以实现对新任务的适应性性能。
它可以根据之前未识别任务的少量样本,自动组织合适的 LoRA 模块,并通过 LoRA 学习的方式进行训练。LoraHub 具有高性能和灵活性,可以在只有 CPU 的计算机上运行,并通过减少推理成本提高效率。它为用户提供了一个共享、访问和应用训练过的 LoRA 模块的平台,为 NLP 任务的开发和应用提供了便利。
项目地址:https://github.com/sail-sg/lorahub
LoraHub 的核心功能是通过 LoRA 的模块化和可组合性,在不需要人工干预或专业知识的情况下,自动组合合适的 LoRA 模块。该方法可以利用仅有的几个样本自动组织适用于新任务的 LoRA 模块。与传统的假设特定任务的训练不同,LoraHub 可以集成满足要求的所有 LoRA 模块。这种学习技术称为 LoraHub 学习,因为它利用了现有的多个 LoRA 模块。
该方法通过在行业标准的 BBH 基准和 Flan-T5作为底层 LLM 的基础上进行评估。结果表明,少样本的 LoraHub 学习过程可以组合适用于新任务的 LoRA 模块,并且与少样本、上下文学习相比,取得了接近的结果。与上下文学习相比,LoraHub 学习不需要将实例作为 LLM 的输入,从而大大降低了推理成本。该学习技术采用无梯度方法生成 LoRA 模块的系数,并且仅需要少量推理步骤。使用单个 A100,在不到一分钟的时间内,该方法可以在 BBH 上实现顶级性能。
LoraHub 的学习只需要了解如何处理 LLM 推理,因此可以在只有 CPU 的计算机上进行。这种灵活性和高性能的工作方式为创建一个易于共享、访问和应用于新任务的训练过的 LoRA 模块的平台铺平了道路。研究团队希望这样的系统可以建立一个具有各种功能的可重复使用的 LoRA 模块库。该团队正在努力动态组合 LoRA 节点,以提高 LLM 的能力。
利用检索增强生成技术提升语言模型的能力
文章要点:检索增强生成(RAG)方法可以让语言模型访问最新的知识库,从而提高模型在实际业务中的应用能力。RAG方法相比重新训练模型或微调模型更为便宜和容易实现,同时也避免了数据集准备的工作量。使用Haystack等开源框架,结合句子嵌入技术和检索算法,可以构建强大的RAG-enabled语言模型,提供准确、实时的信息检索和问题回答能力。站长网2023-08-09 10:15:220000徕卡相机CEO评小米14 Ultra:移动影像光学领域杰出之作
随着小米全新影像旗舰小米14Ultra定档于2月22日发布,官方预热活动已经如火如荼地展开。今日,小米与徕卡相机公司携手,公布了徕卡CEO对小米14Ultra的高度评价,称赞这款新机是移动影像光学领域的杰出之作,搭载了新一代顶级Summilux镜头。站长网2024-02-19 17:26:470000周星驰做短剧,《金猪玉叶》有多少含“周”量重要吗?
“剧情狗血,演技也烂”。这是演员宁静对短剧的评价,但即便如此,她还是能看一百多集,甚至成为了短剧的付费用户。明星都如此上头,短剧到底有什么魔力?一个主要的原因就是短剧能让用户“上瘾”。在C2M模式下,短剧走的是“以销定产”路线,也就是按照受众的喜好来做剧本。在此模式下,呈现出来的内容,既吸睛又吸金。站长网2024-06-08 17:02:380000可灵AI深夜悄悄上线AI模特,他们这是要革电商的命。
现在是夜里1点,我准备了一些素材,正打开可灵,想跑一些关于AI拥抱的视频。然后,发现给我弹了个窗,悄悄的,在深夜,可灵AI里面生图的模型-可图,更新了。我大概测了一下,效果还不错,语义理解有加强,真人效果史诗级强化,而且对亚洲人适配效果极佳。审美也高级了。可图1.5,应该是我玩过的,做亚洲人最好看的一个。0003