智源团队推出「生长策略」 解决大模型训练算力成本过高问题
站长网2023-09-21 09:13:571阅
近日,智源研究院联合中科院计算所、南洋理工大学(新加坡)、电子科技大学(成都)、哈尔滨工业大学(深圳)的研究团队共同提出了一种「生长策略」(growth strategy),以解决大模型算力成本极高的问题。
研究团队基于「生长策略」逐步构建了一个具有1010亿参数的FLM-101B大模型。实际训练结果显示,只需约10万美元(约70万人民币)的算力成本,就能成功训练出一个效果和GPT-3、GLM-130B可比的千亿大模型。

「生长策略」的核心思想是让模型在训练过程中的参数量可以随着训练进行逐步扩展,从较小的参数规模扩展到更大的参数规模。研究团队利用这种策略成功地训练出了 FLM-101B 大模型,并且通过评测发现,该模型在知识能力和智能水平方面具有竞争力。
此外,研究团队还提出了一种基于 IQ 的评测方法,以更全面、客观地评估大模型的智力水平。他们从四个维度对大模型进行了 IQ 测试:符号评测、规则理解、模式挖掘和抗干扰评测。实验结果显示,FLM-101B 在这些评测任务上表现出了非常好的能力。
FLM-101B模型地址:
https://huggingface.co/CofeAI/FLM-101B
0001
评论列表
共(0)条相关推荐
发售不足2个月 跳水一千多!索尼PS VR2只要3298元了
快科技4月11日消息,索尼PSVR2在今年2月22日全球发售,国行售价4499元。截至目前,索尼PSVR2上市不足2个月的时间,但目前已经价格大跳水了一千多元,拼多多百亿补贴频道目前仅需3298元。这个价格跳水的速度和幅度,即便是当年被称为跳水王的三星手机都无法比拟。站长网2023-04-12 13:53:180000AI日报:效果炸裂!Krea Video向所有人开放;阿里花8亿入股Kimi;Arc Search可以打电话了;腾讯智影声音大模型升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、KreaAI视频生成工具向所有人开放站长网2024-05-25 06:37:110000画一笔AI画整张图!AI实时作画方式被打开,颜色细节自动补全,一个脚本即可实现
现在用AI画画,完整草图都不需要了。每一笔落下,AI都会实时交上“新作业”细节、颜色、画布空白,它都自动补全。还能通过提示词来控制生成图像的内容和风格。比如加一句“一个穿长外套的男人站在海边“,AI立马调整了作画方向:最后成稿的作品如下,效果很奈斯。怪不得网友表示,自己惊掉的下巴已经找不到了。这就是最新火起来的AI实时作画项目,Reddit上的热度有1.8万。站长网2023-05-12 20:41:050001苹果研究团队揭示WRAP技术:用合成数据进行预训练大模型 成本低准确性高
**划重点:**1.🔄**预训练效率提升:**WRAP应用于嘈杂的C4数据集,预训练速度提高了近三倍,显著降低了LLM训练的高昂成本和时间投入。2.🚀**模型性能提升:**WRAP在相同计算预算下使模型性能更出色,通过使用Pile的不同子集,减少了超过10%的歧义,并在13种不同活动的零-shot问题回答准确性上提高了超过2%。站长网2024-02-05 10:42:350000通义千问上线AI生成拜年视频功能 提供300套照片模板
阿里云通义千问APP推出多项免费新应用,引入全新图像生成玩法,包括全家福、拜新年、万物成龙等。这次更新涵盖了超过300套照片模板,用户只需上传照片即可生成多样化的主题照片,如全家福、团圆照、拜年照和千里江山等。产品入口:https://top.aibase.com/tool/tongyiqianwen站长网2024-02-05 15:28:580000