鸭嘴兽-70B登顶HuggingFace开源大模型排行榜

站长网2023-08-26 10:25:210阅

要点:

鸭嘴兽-70B使用优化过的数据集Open-Platypus训练，删除相似和重复问题。

应用LoRA和PEFT对模型进行微调，重点优化非注意力模块。

检查并解决测试数据泄漏和训练数据污染问题。

最近，来自波士顿大学的鸭嘴兽-70B模型登顶了HuggingFace的开源大模型排行榜，成为目前全球开源领域中表现最强的语言模型。鸭嘴兽的变强有以下三个关键原因:

首先，鸭嘴兽使用了一个经过优化的开源数据集Open-Platypus进行训练。该数据集由11个开源数据集组合而成，主要包含人工设计的问题，只有约10%的问题是由语言模型生成。同时，研究人员对数据集进行了处理，删除了相似和重复的问题，最大限度地减少了数据冗余。这有助于模型在更小的数据集上获取更强大的能力。

其次，研究人员使用了低秩逼近（LoRA）和参数高效微调(PEFT)对鸭嘴兽模型进行了微调。与完全微调不同，LoRA只训练转换层中的可训练参数，从而大大降低了计算训练成本。PEFT则主要微调了非注意力模块，如门控单元和上下采样模块，这进一步提升了模型性能。相比仅优化注意力模块，这种方法取得了更好的效果。

论文地址:https://arxiv.org/pdf/2308.07317.pdf

最后，研究人员深入探索了开放式语言模型训练中存在的数据污染问题，并针对鸭嘴兽的数据集进行了严格过滤。他们开发了一套启发式方法，仔细检查训练集中与测试集相似的问题，删除或以任何方式将其标记为潜在的测试数据泄露，避免了测试数据非故意地进入训练集，保证了模型评估的公平性。

通过数据集优化、模型微调技巧以及数据质量控制，鸭嘴兽-70B得以在众多开源大模型中脱颖而出，登上榜首。这为语言模型的训练提供了宝贵经验，也使开源社区对自主研发强大AI模型更具信心。如果社会各界能坚持开放创新、合作共赢的理念，我们离强人工智能的到来就不会太远了。

鸭嘴兽70B登顶HuggingFace开源大模型排行榜

0000

评论列表

共(0)条

相关推荐

站长资讯
Character.AI 加入 AI 群聊功能：用户可与多个人工智能角色相互交谈
Character.AI是一家由前GoogleAI研究人员创建的AI聊天机器人初创公司，由a16z支持，今天为其订阅者推出了一项新功能。该聊天机器人平台提供具有独特个性的可定制人工智能伴侣以及可定制的工具，现在提供群聊体验，用户和他们的朋友可以同时与多个人工智能角色聊天。图片来自Character.ai
站长网2023-10-12 09:04:56
0002
站长资讯
Bing AI图片生成器拒绝生成女性的逼真图像，称其“不安全”
划重点:1.Bing的AIImageCreator在生成男性逼真图像方面表现出色，但在生成女性图像时却拒绝，称其不符合内容政策。2.用户发现Bing的AI存在性别相关的奇怪问题，生成女性图像经常被阻止，可能与训练数据中女性被性化有关。3.微软回应称AI的拒绝是出于过度防护，但随后放宽了对女性图像的生成限制。
站长网2023-10-27 10:18:10
0000
站长资讯
AI图像编辑器Photoroom以5亿美元估值融资了4300万美元
Photoroom是一款来自巴黎的基于人工智能的照片编辑应用程序，它像杂草一样生长，目标是在线做生意的人，同时也吸引了大量休闲用户。该应用程序确认已完成最新一轮融资:4300万美元，最新一轮融资估值达到5亿美元。）表示，他与首席技术官艾略特·安德烈斯（EliotAndres)共同创立了Photoroom。
站长网2024-02-28 10:23:53
0001
站长资讯
AI编写毛伊岛野火历史书籍成“亚马逊畅销书” 被指助长阴谋
本文概要:1.一本AI编写的关于毛伊岛野火的历史书成为亚马逊畅销书，引发了重大争议。2.这本书的写作风格显示出它可能是由AI生成的，评论家对其进行了严厉批评。3.有人认为这本书是灾难计划或预知的证据，加剧了关于野火起源的阴谋论。最近，一本旨在讲述本月致多人死亡的夏威夷毛伊岛野火历史的书已成为亚马逊上的畅销书，尽管评论家对该书进行了严厉批评，因为该书籍与人工智能生成的散文相似。
站长网2023-08-19 15:25:29
0000
站长资讯
三星Galaxy S23系列发布价格5699元起
今日凌晨，三星GalaxyS23系列正式发布，包含S23、S23、S23Ultra三款机型，均搭载骁龙8Gen2处理器。
站长网2023-04-12 15:54:49
0000