phi-3安装指南:如何在 MacBook Pro 上微调 phi-3
博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。
要安装 AutoTrain Advanced,您可以执行以下操作:
$pipinstallautotrain-advanced
注意:autotrain不安装pytorch、torchvision等,所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:
$condacreate-nautotrainpython=3.10
完成后,您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!
AutoTrain 不仅提供 LLM 微调,还提供许多其他任务,例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中,我们正在研究 LLM 微调。
您可以通过执行以下操作来查看可以调整 llm 微调的所有参数
$autotrainllm--help
下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。
对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:[{"content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{"content":"32","role":"assistant"}]
您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。
对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。
使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:
autotrainllm其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。
请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:
autotrainllm接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.
autotrainllm以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。
现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。
要使用用户界面:
$exportHF_TOKEN=your_huggingface_write_token
然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:
如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)
SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。
详细文档点此查看:https://huggingface.co/docs/autotrain/index
大佬谈AI|库克要让国行版iPhone装上百度AI 周鸿祎剖析库克盘算,黄仁勋、Altman语出惊人!
3月25日消息,过去一周,国内外AI圈子又有众多话题涌现。苹果公司CEO蒂姆·库克(TimCook)的中国之行成为观察苹果生成式AI发展动态的窗口;英伟达的2024GTC大会CEO黄仁勋携新的超级GPU亮相,要为更大规模的生成式AI模型训练扫清算力障碍。0001谷歌被秒杀!高保真3D头像逼真到恐怖 小姐姐挤眼,挑眉毫无破绽
最近,一项由德国慕尼黑工业大学(TUM)和伦敦大学学院(UCL)等研究团队提出的新算法——NPGA(NeuralParametricGaussianAvatar),引起了广泛关注。这项技术能够生成高保真3D头像,逼真的表情甚至让人怀疑自己的眼睛。从官方给出的演示可以看到,NPGA生成的小姐姐不仅可以做出挤眼,挑眉,嘟嘴等各种丰富的表情,而且眼神细节等丝毫看不出破绽,俨然和真人无异。站长网2024-05-31 19:47:320001“AI”被柯林斯词典评为 2023 年最受关注的单词
柯林斯词典今年选择“人工智能”(AI)为2023年最受关注的词汇。这一术语的使用量在过去一年中增加了四倍,反映了它在当今社会中日益增长的影响力。人工智能被定义为“通过计算机程序模拟人类心智功能”。柯林斯词典的编纂者表示,人工智能发展速度如此之快,已经成为2023年的主导话题。站长网2023-11-01 10:44:170000南洋理工开源创新性文生视频模型FreeInit
要点:1、创新性文生视频模型FreeInit通过重新初始化噪声,改进时间的一致性。2、研究人员发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除。3、FreeInit通过多次迭代重复采样优化过程,提升低频信息质量,改善生成视频质量。南洋理工大学S实验室的研究人员开源了一种创新性文生视频模型,名为FreeInit。他们发现视频扩散模型在生成视频时存在时间一致性不足和不自然的动态效果。站长网2024-01-05 09:38:420000荷兰将立即实施《欧盟人工智能法案》 投资2.22亿美元
1月18日周四荷兰政府表示,将“立即”开始遵守欧洲具有里程碑意义的《人工智能法案》,荷兰已拨出2.045亿欧元(2.2207亿美元)用于促进当地对人工智能的投资。图源备注:图片由AI生成,图片授权服务商Midjourney这些公告是在一份文件中发布的,该文件概述了政府在防范风险的同时利用ChatGPT等生成式人工智能系统的战略。站长网2024-01-19 12:01:460000