Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等
站长网2024-02-02 10:48:594阅
Allen人工智能研究机构在Hugging Face和GitHub上发布了首个开放语言模型OLMo,意在通过提供数据、代码、模型和评估工具的开放访问,促进人工智能领域的共同研究。
这一举措的首批模型包括7B和1B规模的变体,覆盖不同架构和训练硬件,为未来更大规模、指令调整等模型的发布奠定基础。每个模型都提供全面的训练数据、权重、代码和评估工具,并在Apache2.0许可证下发布,鼓励合作构建全球最佳的开放语言模型。
截图来自官方
为了创建强大的开放模型,A12在设计中吸取了多个开放和部分开放模型的经验教训,包括EleutherAI的Pythia Suite、MosaicML的MPT模型、TII的Falcon模型和Meta的Llama系列。
对OLMo7B型号进行的评估显示,在生成任务和阅读理解上,它在许多任务上领先于Llama2,但在一些流行的问答任务上略显落后。通过与不同模型进行比较,OLMo展现出自己的优势和劣势,成为Llama2等流行模型的有力替代品。
在技术方面,OLMo的架构遵循了最新文献的趋势,包括不使用偏差、SwiGLU激活函数、Rotary位置嵌入(RoPE)等。通过一系列实验和调整,AI2发布了OLMo的第一个版本,并鼓励阅读技术报告以深入了解模型架构和培训方法。
未来,A12计划在OLMo家族中推出不同模型尺寸、模态、数据集、安全措施和评估方法,以共同构建全球最佳的开放语言模型。
OLMo的推出标志着AI2在开放研究领域的重要一步,其框架和模型的开放性为学者和研究人员提供了广泛的研究问题,推动了人工智能领域的不断发展。通过提供权重的开放访问,并鼓励合作,Allen致力于共同构建全球最卓越的开放语言模型,助力人工智能技术的进步。
0004
评论列表
共(0)条相关推荐
短视频平台现雷军、周鸿祎模仿者 平台回应:或涉嫌侵权
在近日的短视频平台上,一股模仿热潮悄然兴起,其中最为引人注目的莫过于对雷军和周鸿祎的模仿。两位企业家的独特风格与魅力,吸引了众多网友的关注和模仿。站长网2024-05-06 17:54:070000全国首例AI声音侵权案公开审理 一配音起诉魔音工坊APP、微软等五被告
12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案”。原告殷某某以配音为职业,曾录制多部有声作品。殷某某意外发现,自己的声音被AI化后,在一款名为“魔音工坊”的APP上以“魔小璇”的名义对外出售。因此,殷某某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京小问智能科技有限公司等五被告起诉到北京互联网法院。0000专家预测:人工智能将是人类灭绝的首要原因,其次是核战争和病毒
本文概要:1.专家预测人工智能将是人类灭绝的首要原因。2.核战争和病毒将是人类继人工智能后可能导致灭绝的原因。据印度媒体indianexpress报道,在“生活、科学与一切事物”系列讲座中,科学家兼前印度科学与工业研究理事会总干事谢卡尔·曼德博士谈到了人类灭绝的问题,以及其他相关议题。站长网2023-08-15 11:26:2300021400元一次,爆改风吹到普通女孩身上,郭敬明的新一轮变现开始了
郭敬明又拿捏住了年轻人。十年前,他用文字吸引了大批粉丝;十年后,他又用审美抓住了流量。今年年初,郭敬明在上海开了一间妆造店“SHISPACE舍作”。尽管人均消费1400,但开业不到三个月迅速火成上海美容热门榜No.1。有句话叫:你可以嘲笑郭敬明的剧本,但你不能质疑他的审美。别看郭敬明拍过的剧评分都不算高,但他的剧总能出圈,审美始终在线。站长网2024-05-17 18:00:110000VIFA将于8月17日发布全球首款ChatGPT音箱“ChatMini”
智度股份宣布,全球首个内置ChatGPT智能音箱VifaChatMini将于8月17日发布,售价为259美元。该智能音箱具有更小的体积和更强的便利性,并且内置了ChatGPT和百度文心一言双AI,可以进行更丰富的对话,包括创作诗歌、提供安慰等。站长网2023-08-11 15:13:050000