英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑
**划重点:**
1. 🌐 Nemotron-4是英伟达最新的通用大模型,拥有150亿参数,在各语言和编码任务中表现出色。
2. 💡 该模型采用Chinchilla模型的「缩放定律」,通过优化计算预算、数据和模型大小实现性能提升。
3. 🔥 在多领域下游评估中,Nemotron-415B超越同等参数规模的模型,甚至击败4倍大的模型,成为最强通用语言模型。
英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8T token上的训练,在英语、多语言和编码任务中表现出色。具体而言,Nemotron-4在7个评估基准上的15B模型表现优异,超越同等参数规模的模型,甚至击败了4倍大的模型。
该模型的设计灵感来自Chinchilla模型的「缩放定律」,该定律强调在给定固定计算预算的情况下,同时优化数据和模型大小。与过去主要关注模型大小不同,这一研究强调将计算分配给更多数据的训练,以降低延迟和服务模型所需的计算量。因此,Nemotron-4的主要目标是打造一个能在单个英伟达A100或H100GPU上运行的最佳「通用大模型」。
在架构方面,Nemotron-4采用了标准的纯解码器Transformer架构,并带有因果注意掩码。核心超参数包括32亿个嵌入参数和125亿个非嵌入参数。在数据方面,研究人员使用了包含8万亿个token的预训练数据集,分为英语自然语言数据(70%)、多语言自然语言数据(15%)和源代码数据(15%)。
为了实现这一庞大模型的训练,Nemotron-4使用了384个DGX H100节点,每个节点包含8个英伟达H10080GB SXM5GPU。在16位浮点(bfloat16)算术下,每个GPU的峰值吞吐量为989teraFLOP/s。研究人员通过张量并行和数据并行的组合进行训练,并使用了分布式优化器。
在下游评估中,Nemotron-4在各领域均表现强劲,特别是在常识推理、热门综合基准和数学、代码任务上。该模型在多语言分类和生成任务中也实现了最佳性能,展现了其在不同语言的卓越理解能力。值得注意的是,Nemotron-4在机器翻译任务中取得了显著的进展,不仅在中文翻译成英文方面表现出色,而且在中文直接翻译成其他语言方面也取得了印象深刻的效果。
Nemotron-4的推出标志着英伟达在通用大模型领域的一次重要突破,为单个A100或H100GPU上运行的最佳通用大模型设定了新标准。
论文地址:https://arxiv.org/abs/2402.16819
B站2023百大UP主名单公布 1月6日将举行百大 UP 盛典
B站2023百大UP主名单已经公布了。这个名单评选标准为创作的「专业性、影响力、创新性」三个维度,从中选出了2023年度的百大UP主。百大UP主盛典将于1月6日在B站直播,100多位UP主将会参与。用户可以在B站上搜索“百大”预约直播。以下为获奖者具体名单:站长网2024-01-02 14:27:180000百度旗下集度汽车更名为极越,获得生产资质
站长之家(ChinaZ.com)8月15日消息:据经济观察网报道,百度旗下的集度汽车近日传出了重要消息,已经正式更名为极越。这一变更也反映在他们的官方网站上,现已更名为极越汽车机器人。与此同时,极越汽车也获得了生产资质,并有望在今年下半年发布首款车型“极越01”。0000单篇赚两万,AI写短剧是噱头还是风口?
重生之我用AI写短剧故事。打开MidReal最新网页版,页面中间偌大的标语写着“What’syourfantasy?(你的幻想是什么?)”和引导用户输入提示词的对话框。免费体验网页版MidReal链接:https://midreal.ai/如果没有这个设计,它看上去更像一个短剧平台。只需轻轻下滑页面,时下爆火的短剧标题随即映入眼帘,从修仙到重生,从霸总虐恋到穿越甜宠,都能在这上面找到:站长网2024-04-19 17:24:120000IDC:2027 年生成式 AI 支出将达到 1430 亿美元
站长之家(ChinaZ.com)10月17日消息:现在几乎每家大公司都在寻找方法将人工智能纳入他们的业务计划,投资于构建或采用生成式人工智能模型来执行特定任务。国际数据公司(IDC)的一份新报告预测,这种支出只会增加。IDC预测,到2027年,用于生成式人工智能解决方案的支出,包括软件、相关基础设施硬件以及实施生成式人工智能所需的IT/业务服务,将达到1430亿美元。站长网2023-10-18 11:43:060000不涨薪144%就不干活!印度三星工厂罢工欲扩大至全国
快科技9月16日消息,自9月10日以来,三星在印度金奈的工厂因劳工抗议低薪而爆发的罢工已持续数天。这场由印度工会中心(CITU)支持的罢工,要求三星在三年内将工人工资提高144%,以应对日益增长的生活成本。不仅是三星,CITU还计划把罢工行动扩大至全国电子产业。CITU表示,三星工厂工人目前每月平均收入约300美元,远低于他们的生活需求,因此提出在三年内加薪约430美元。0000