phi-3安装指南:如何在 MacBook Pro 上微调 phi-3
博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。
要安装 AutoTrain Advanced,您可以执行以下操作:
$pipinstallautotrain-advanced
注意:autotrain不安装pytorch、torchvision等,所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:
$condacreate-nautotrainpython=3.10
完成后,您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!
AutoTrain 不仅提供 LLM 微调,还提供许多其他任务,例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中,我们正在研究 LLM 微调。
您可以通过执行以下操作来查看可以调整 llm 微调的所有参数
$autotrainllm--help
下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。
对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:[{"content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{"content":"32","role":"assistant"}]
您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。
对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。
使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:
autotrainllm其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。
请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:
autotrainllm接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.
autotrainllm以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。
现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。
要使用用户界面:
$exportHF_TOKEN=your_huggingface_write_token
然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:
如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)
SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。
详细文档点此查看:https://huggingface.co/docs/autotrain/index
时薪15美元的ChatGPT外包工人,干的都是苦力活
自ChatGPT去年11月发布以来,让不少打工人陷入担心失业的恐慌中,也解决了部分人的“就业问题”。34岁的AlexejSavreux,就是其中之一。作为ChatGPT外包大军的一员,这份工作让AlexejSavreux从体力劳动的工人,摇身一变成为了AI训练师。然而,华丽的蜕变之后,这份工作似乎没有想象中的光鲜……除15美元时薪外,没有其它福利站长网2023-05-09 09:25:030000FF第二阶段共创交付正式启动 计划8月中旬交付FF 91
FF(FaradayFuture)今天宣布第二阶段共创交付正式启动,并将向首批用户交付FF912.0FuturistAlliance。同时,FF还顺利完成了FF912.0FuturistAlliance的所有合规性测试。站长网2023-08-01 16:36:550000谷歌Gemini离谱翻车,马斯克被大黑特黑
事情是这样的。最近有很多网友陆陆续续发现啊,Gemini在文生图的时候,好像刻意在拒绝生成白人的形象。取而代之的,是强行把图中的人物变成黑人、女性,以及弱势群体。就拿马斯克本尊来说吧,一位网友让Gemini生成他的形象。然后……就有了上面这张照片。而且马斯克还不是个例,很多网友在尝试让Gemini文生图的时候都仿佛中了“黑色魔力圈”一样。站长网2024-02-25 14:55:160000DeepMind发布自监督扩散模型SODA
GoogleDeepMind昨天发布的一项研究展示了一项引人注目的技术,尽管其中的技术细节可能需要深入理解,但总体来说,通过一系列操作,可以以无监督的方式精准控制扩散模型,从而实现风格和内容的分离,以及合成物品的3D视图等功能。论文地址:https://soda-diffusion.github.io/站长网2023-12-01 12:16:310000Character.AI 加入 AI 群聊功能:用户可与多个人工智能角色相互交谈
Character.AI是一家由前GoogleAI研究人员创建的AI聊天机器人初创公司,由a16z支持,今天为其订阅者推出了一项新功能。该聊天机器人平台提供具有独特个性的可定制人工智能伴侣以及可定制的工具,现在提供群聊体验,用户和他们的朋友可以同时与多个人工智能角色聊天。图片来自Character.ai站长网2023-10-12 09:04:560000