Mozilla 让人们将 AI LLM 变成单文件可执行文件,简化大型语言模型的分发和运行
供本地使用的 LLM(大型语言模型)通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整,如果使用不同的版本,则会导致不同的结果。
Mozilla 的创新团队最近发布了 llamafile,这是一种开源方法,用于将一组权重转换为单个可在六种不同操作系统(macOS、Windows、Linux、FreeBSD、OpenBSD 和 NetBSD)上运行的二进制文件,无需安装。这大大简化了大型语言模型(LLMs)的分发和运行,并确保特定版本的 LLM 保持一致性和可重现性。
这一成就离不开 [Justine Tunney] 的贡献,他是一次构建、多处运行框架 Cosmopolitan 的创造者。另一个主要部分是 llama.cpp,它在运行自托管 LLM 方面具有重要作用。
有一些使用 Mistral-7B、WizardCoder-Python-13B 和 LLaVA 1.5 LLMs 的示例二进制文件可供使用。需要注意的是,如果您使用的是 Windows 平台,只有 LLaVA 1.5 能运行,因为它是唯一一个符合 Windows 对可执行文件 4 GB 大小限制的模型。如果遇到问题,请查看「常见问题」列表以获取故障排除提示。
llamafile 的发布标志着在大型语言模型的分发和运行方面的进步。这不仅降低了使用这些模型的技术门槛,也使得开发者和研究人员能够更容易地在多种操作系统上使用这些强大的 AI 工具。
随着越来越多的 LLMs 的开发和应用,llamafile 提供了一个有效的解决方案,以确保这些模型的有效和一致的使用。
据了解,在这里提到的权重是指在机器学习和人工智能领域中的一个术语。在大型语言模型(LLMs,如 GPT-4)中,权重是模型在训练过程中学习到的参数,用来确定输入数据如何转换为输出结果。这些权重决定了模型如何解释和处理输入的数据。
因此,当说到 LLMs 通常以多个 Gigabyte 的文件形式分发一组权重时,意味着这些文件包含了模型在训练过程中学到的所有必要参数。这些权重文件本身不能直接使用,需要通过特定的软件框架或环境来加载和运行,这使得与其他类型的软件相比,它们的分发和运行更加复杂。
一碗「番茄肥牛饭」的 AI 之旅
很多走在前沿的企业正在用AIGC辅助进行快速进化,并在用更短的时间进行弯道超车。比如这次我们要聊的这家餐饮公司,认识他们,可以先从一些数据开始:-关于小红书推广,使用AI数字员工后,至少能帮助节省1个运营人员、2个文案、3个设计,大大降低了成本。-关于新品研发,使用AI工具后,周期缩短的同时,判断也更精准了。之前仅做产品调研就要用一个月,现在几天就能快速决策和搞定。站长网2023-12-27 12:17:160000超越ControlNet++!腾讯优图提出动态条件选择新架构
超越ControlNet,让文生图更可控的新框架来了!ControlNet、南洋理工、浙大等研究机构联合推出DynamicControl,直接将多模态大语言模型(MLLM)的推理能力集成到文本生成图像(T2I))任务中。而且还提出了一种新颖、高效的多控制适配器,可以自适应地选择不同的条件,从而实现动态多控制对齐。0000董宇辉新账号“与辉同行”今晚首播 未开播已有400万粉丝
站长之家(ChinaZ.com)1月9日消息:近期,在东方甄选小作文事件之后,董宇辉宣布成立个人工作室新账号“与辉同行”,并宣布将于今晚进行首次直播。这一消息引发了广泛关注,目前该账号尚未开播,粉丝量已经突破了400万。董宇辉表示,独立工作室会坚持销售农产品,同时他也有更多自由去做想做的事。除了日常直播以外,他计划腾出更多时间去采访作家、推荐书籍,并游览各地的风景名胜。0000中国移动:在人工智能、算力网络等相关领域已有布局
中国移动表示,ChatGPT标志着生成式通用人工智能时代加速到来,可能会引发人类生产方式、生活方式、工作方式巨大的变化,其背后是大模型、大计算、大数据。公司在人工智能、算力网络、数据要素相关领域已有布局:一是已经构筑了算力网络,会在AI算力方面发挥巨大作用;二是公司的能力中台中包括技术中台,已沉淀超300项AI能力;站长网2023-06-13 17:58:270000新一代安卓操作系统Android 14正式发布:首批支持手机品牌公布 小米等在列
快科技10月5日消息,周三谷歌在纽约举行了一年一度的MadebyGoogle2023发布会,除了Pixel8和Pixel8Pro两款手机之外,还发布了新版安卓系统Android14,以及生成式AI加持的谷歌助手AssistantwithBard。站长网2023-10-05 22:11:2700032