鸭嘴兽-70B登顶HuggingFace开源大模型排行榜
要点:
鸭嘴兽-70B使用优化过的数据集Open-Platypus训练,删除相似和重复问题。
应用LoRA和PEFT对模型进行微调,重点优化非注意力模块。
检查并解决测试数据泄漏和训练数据污染问题。
最近,来自波士顿大学的鸭嘴兽-70B模型登顶了HuggingFace的开源大模型排行榜,成为目前全球开源领域中表现最强的语言模型。鸭嘴兽的变强有以下三个关键原因:
首先,鸭嘴兽使用了一个经过优化的开源数据集Open-Platypus进行训练。该数据集由11个开源数据集组合而成,主要包含人工设计的问题,只有约10%的问题是由语言模型生成。同时,研究人员对数据集进行了处理,删除了相似和重复的问题,最大限度地减少了数据冗余。这有助于模型在更小的数据集上获取更强大的能力。
其次,研究人员使用了低秩逼近(LoRA)和参数高效微调(PEFT)对鸭嘴兽模型进行了微调。与完全微调不同,LoRA只训练转换层中的可训练参数,从而大大降低了计算训练成本。PEFT则主要微调了非注意力模块,如门控单元和上下采样模块,这进一步提升了模型性能。相比仅优化注意力模块,这种方法取得了更好的效果。
论文地址:https://arxiv.org/pdf/2308.07317.pdf
最后,研究人员深入探索了开放式语言模型训练中存在的数据污染问题,并针对鸭嘴兽的数据集进行了严格过滤。他们开发了一套启发式方法,仔细检查训练集中与测试集相似的问题,删除或以任何方式将其标记为潜在的测试数据泄露,避免了测试数据非故意地进入训练集,保证了模型评估的公平性。
通过数据集优化、模型微调技巧以及数据质量控制,鸭嘴兽-70B得以在众多开源大模型中脱颖而出,登上榜首。这为语言模型的训练提供了宝贵经验,也使开源社区对自主研发强大AI模型更具信心。如果社会各界能坚持开放创新、合作共赢的理念,我们离强人工智能的到来就不会太远了。
华为PixArt-Σ放出模型文件 可在Comfyui使用
最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。可以在Comfyui上尝试。工作流地址:https://civitai.com/models/420163站长网2024-04-29 19:28:180001微信整治短视频信息内容导向不良问题 严重违规将从严处置
微信发文称,为贯彻落实中央网信办统一部署,进一步促进短视频领域规范发展,自即日起,微信将开展为期一个月的“清朗·整治短视频信息内容导向不良问题”专项行动。专项行动期间,平台将重点治理短视频传播虚假信息、错误观念,展示不当行为等突出问题,对于问题严重的违规不良信息及账号,将依据相关法律法规、平台规则从严处置。0000《财富》发布全球人工智能创新者50强榜单 百度入选
昨日,《财富》发布了首届全球“《财富》人工智能创新者50强榜单”,百度成为唯一入选该榜单的中国企业。站长网2023-11-22 16:49:440000官宣!杭州亚运会门票正式开售, 支付宝搜“亚运”可在智能亚运一站通购买
7月8日10点,杭州亚组委宣布:本届亚运会公众售票官方网站正式上线开放注册,大家可以在公众售票官方网站(https://ticket.hangzhou2022.cn/),或上支付宝搜“亚运”,进入智能亚运一站通的票务通购买比赛门票。今日也将分四批开售举重、克柔术、网球、花样游泳、击剑、摔跤、蹦床、高尔夫球、跳水、游泳、软式网球、攀岩共12个项目。站长网2023-07-10 00:07:270000苹果公司未能阻止Watch Series 9和 Ultra 2的进口和销售禁令
苹果公司未能推迟对WatchSeries9和WatchUltra2的进口和销售禁令。美国国际贸易委员会(ITC)驳回了苹果公司在等待上诉期间暂缓实施禁令的动议。该禁令将于12月26日正式生效。苹果公司已宣布将在12月24日之前将这两款手表从其商店下架。目前该禁令仅在美国有效,百思买等第三方零售商仍然可以销售这对手表,直到供应耗尽。站长网2023-12-21 10:39:030000