AI2发布开放语言模型OLMo 号称多项性能媲美Llama2
**划重点:**
1. 🚀 AI2发布了开放语言模型(OLMo),该框架旨在促进大规模语言模型的研究和实验,通过在Hugging Face和GitHub上提供训练代码、模型和评估代码来实现。
2. 🛠 OLMo的首批模型包括7B规模的四个变体和1B规模的一个模型,涵盖不同的架构、优化器和训练硬件,旨在满足多样化的研究需求。
3. 🌍 该项目的目标是建立全球最好的开放语言模型,已经启动不同规模、模态、数据集、安全措施和评估等方面的工作。
AI2最新发布的开放语言模型(OLMo)框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码,AI2致力于让学术界和研究人员能够共同研究语言模型的科学,探索新的预训练数据子集对下游性能的影响,以及研究新的预训练方法和稳定性。

该项目的首批模型包括四个7B规模的最终变体,对应不同的架构、优化器和训练硬件,以及一个1B规模的模型,所有模型均在至少2T令牌上进行了训练。这是一个长期计划的第一步,计划继续发布更大规模的模型、经过指导调整的模型以及更多变体。
每个模型都提供完整的训练数据,包括生成训练数据的代码,以及用于分析预训练数据的AI2的Dolma和WIMBD。此外,还提供了完整的模型权重、训练代码、训练日志、以Weights & Biases日志形式呈现的训练指标,以及推理代码。每个模型的训练过程中的500多个检查点也可在HuggingFace上作为修订版本获得。

在创建强大的开放模型时,AI2从许多其他开放和部分开放的模型中吸取了经验,并将它们作为OLMo的竞争基准。该项目的技术报告提到,OLMo7B模型在诸如生成任务或阅读理解(如truthfulQA)等方面超过了Llama2,但在流行的问答任务(如MMLU或Big-bench Hard)上略显落后。
对于1B OLMo模型,使用AI2的Paloma和可在GitHub上获得的检查点进行了分析,以探讨模型在语言预测和模型规模等因素之间的关系。AI2强调Paloma的方法试图通过均匀采样各个领域,更平衡地表示使用语言模型的众多领域。
OLMo框架采用了最新文献中的许多趋势,包括不使用偏见(如PaLM中的稳定性)、PaLM和Llama使用的SwiGLU激活函数、Rotary位置嵌入(RoPE)以及GPT-NeoX-20B的BPE基础标记器的修改版本,旨在减少个人可识别信息。
该发布仅是OLMo和框架的开端,未来计划推出不同规模、模态、数据集、安全措施和评估等方面的工作。AI2鼓励使用OLMo模型,提供了简便的安装步骤和使用示例,并表示未来将推出指导调整的模型、完整的训练日志和wandb报告等功能。
博客网址:https://blog.allenai.org/olmo-open-language-model-87ccfc95f58
项目入口:https://top.aibase.com/tool/olmo
数字人带货,别搞!死亏!
各位村民好,我是村长。想用数字人做抖音,别想了!典型给别人送钱!这小半年来,数字人直播带货、数字人短视频异常火热。而且伴随着ChatGPT等各种AI大模型的兴起,大家心里甚至有一种数字人可以完全替代真人做短视频、直播带货的想法。而对于这种想法,我想说,简直是异想天开。01、数字人只能解决偷懒问题很多人为什么要用数字人拍短视频,搞直播?站长网2023-07-02 18:04:310000想打工的年轻人,掉进美丽“副业陷阱”
站长之家编辑导读:本文讲述了年轻人越来越多地将副业作为自己的职场PlanB,并分享了一些年轻人在副业领域的成功经历。然而,副业成功并不容易,需要有赔钱的底气、技能傍身和自律等条件。通过故事中的案例可以看出,有备而来、不断学习和折腾、坚持写作等都是成功副业的关键要素。同时,主业和副业之间的平衡也是很重要的,副业可以成为人们的精神避难所,让人们对主业更加有动力和愉悦感。站长网2023-07-19 14:15:520000小米14 Ultra首发!小米申请“小米龙铠”商标
近日,小米科技有限责任公司向相关机构提交了两枚名为“小米龙铠”的商标申请,涉及科学仪器和网站服务两大国际分类,目前正处于等待实质审查的阶段。这一举动引发了业界的广泛关注。值得一提的是,小米龙铠架构已经在小米14Ultra手机上实现了首发搭载。这是一种创新的综合性机身防护方案,显著提升了手机中框、屏幕以及背壳的耐用性和耐摔程度,为用户带来了更为安全的使用体验。站长网2024-03-11 16:07:240000揭秘快手可灵背后的「关键7人」
国内风头最盛的AI视频团队是哪家?毫无疑问,快手可灵。发布一个月,体验用户超30万,生成700万条短视频,开放网页Web端。哪怕这样,可灵还是一号难求,想上手体验的急得嗷嗷的。而比可灵本身更神秘、更令人好奇的,是缔造出这款中国版Sora的背后团队。量子位全网搜索,根据公开资料,发现了可灵团队来自清华、中科大、港科大、浙大、港中文、上海交大、南京大学等的“关键七人”。站长网2024-07-15 09:19:440000eBay推出AI生成工具,卖家上传图片即可生成产品列表
文章概要:1.eBay最新引入的AI工具可利用卖家上传的图片,自动生成产品标题、描述和相关分类。2.该工具旨在简化销售流程,特别是对新卖家而言,使其无需提供繁琐的产品信息。3.不过卖家对于早期版本的AI工具生成的文本质量的不满。eBay于近日推出了一项全新的AI工具,旨在帮助卖家更轻松地创建产品列表。站长网2023-09-08 11:42:570000