phi-3安装指南:如何在 MacBook Pro 上微调 phi-3
博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。
要安装 AutoTrain Advanced,您可以执行以下操作:
$pipinstallautotrain-advanced
注意:autotrain不安装pytorch、torchvision等,所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:
$condacreate-nautotrainpython=3.10
完成后,您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!
AutoTrain 不仅提供 LLM 微调,还提供许多其他任务,例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中,我们正在研究 LLM 微调。
您可以通过执行以下操作来查看可以调整 llm 微调的所有参数
$autotrainllm--help
下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。
对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:[{"content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{"content":"32","role":"assistant"}]
您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。
对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。
使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:
autotrainllm其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。
请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:
autotrainllm接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.
autotrainllm以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。
现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。
要使用用户界面:
$exportHF_TOKEN=your_huggingface_write_token
然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:
如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)
SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。
详细文档点此查看:https://huggingface.co/docs/autotrain/index
OpenAI 的 ChatGPT app 在推出的短短 6 天内下载量超过 50 万次
根据应用程序情报提供商data.ai的新分析显示,尽管OpenAI的ChatGPT应用在今天才扩展到11个市场,但其表现非常出色。根据数据,该应用在发布后的前六天就已经突破了50万次下载,这使其成为今年和去年发布的最成功的新应用之一。站长网2023-05-26 10:56:310000iPhone 16系列设计不变!明年才会有重大变化
据知名分析师郭明錤透露,苹果最新推出的iPhone16系列在设计上并不会有任何重大变化。他预计,苹果最早要到2025年才会推出全新设计的iPhone,并拥有更全面、更有差异化的生成式AI或应用程序。郭明錤指出,采用全新设计、拥有更智能的AI要等明年iPhone17系列才会出现。此前,投行巴克莱也预测,iPhone16系列可能不会有大的改变,没有更具吸引力的功能或升级。站长网2024-01-31 10:38:460000微软应用商店 AI 摘要功能开始向 Windows Insider 提供预览版
站长之家(ChinaZ.com)7月25日消息:自从微软推出了面向开发者的AI中心以来已经过去了一段时间。其中最受期待的功能之一是在MicrosoftStore上的AI摘要器,它可以在几秒钟内将数百甚至数千条在线评论总结成一个简洁的段落。站长网2023-07-26 08:59:160000红薯智语:小红书AI文案生成器 ,上传图片直接生成爆款文案
想发小红书有了图片素材,却还在还在为写文案而烦恼?本文跟大家分享一款上传一张图片就能生成爆款文案的小红书AI文案生成器【红薯智语】。产品网址:https://space.chinaz.com/这款神器能实现什么样的效果呢?比如下图上传了一张仿生人的图片,默认效果下,就能生成文案:“大家好,我是一个AI,我将要接管世界!”站长网2024-01-25 11:45:010000AI虚拟陪伴聊天应用如此火爆,为什么没有中国版Character.ai出现?
三句话,让生气的AI恋人原谅我。最近,一款名为“哄哄模拟器”的AI聊天产品突然走红。与单纯提供陪伴、情绪价值的AI聊天应用不同,哄哄模拟器更像是一个练习高情商对话的小游戏。游戏内预设了多种常见的情侣吵架场景,包括但不限于:你需要想方设法在限定聊天轮次内,哄好自己的AI女友or男友,获得Ta的原谅。是否哄好由“原谅值”来决定,原谅值会随着聊天发生变化。站长网2024-01-30 11:57:3600012