注册

训练时间长了还有

首页标签训练时间长了还有

站长资讯
谷歌：大模型不仅有涌现能力，训练时间长了还有「领悟」能力
模型在达到一定规模时会出现涌现现象，谷歌的研究表明，模型在训练到一定时间后，会出现另一种现象，即「领悟」现象。2021年，研究人员在训练一系列微型模型时取得了一个惊人的发现，即模型经过长时间的训练后，会有一个变化，从开始只会「记忆训练数据」，转变为对没见过的数据也表现出很强的泛化能力。这种现象被称为「领悟（grokking）」，如下图所示，模型在长时间拟合训练数据后，「领悟」现象会突然出现。
站长网2023-08-16 09:29:57
0000

热点

前Meta高管：如果强制执行版权许可， AI行业将“一夜之间垮掉”！
2025-05-28 17:01:41
Mythik获1500万美元种子轮融资，要成为“东方迪士尼”
2025-05-26 15:15:05
手机满意度跌至 10 年来的水平，AI人工智能只是部分原因
2025-05-26 15:13:49
OpenAI 进军硬件领域，将收购 Jony Ive 的 AI 创业公司
2025-05-26 15:13:15
蜜雪冰城回应网友倒卖柠檬水赚差价，网友：这违法吗？
2025-05-26 15:13:06
苹果开放 AI 模型……计划于下个月在 WWDC 上发布
2025-05-26 15:12:02
马斯克：特斯拉将于 6 月底在奥斯汀启动 Robotaxi 试点
2025-05-26 15:11:44
谷歌推出 Beam AI：将普通视频通话，转为逼真的 3D 沉浸式体验
2025-05-26 15:10:44
本田大幅削减电动汽车投资，将重点转向混合动力汽车及柔性制造
2025-05-26 14:29:29
骆歆 Rita 领衔！《剑侠情缘?零》明星主播天团助阵公测
2025-05-26 14:28:30

关注

Mythik获1500万美元种子轮融资，要成为“东方迪士尼”
2025-05-26 15:15:05
手机满意度跌至 10 年来的水平，AI人工智能只是部分原因
2025-05-26 15:13:49
OpenAI 进军硬件领域，将收购 Jony Ive 的 AI 创业公司
2025-05-26 15:13:15
蜜雪冰城回应网友倒卖柠檬水赚差价，网友：这违法吗？
2025-05-26 15:13:06
苹果开放 AI 模型……计划于下个月在 WWDC 上发布
2025-05-26 15:12:02
马斯克：特斯拉将于 6 月底在奥斯汀启动 Robotaxi 试点
2025-05-26 15:11:44
谷歌推出 Beam AI：将普通视频通话，转为逼真的 3D 沉浸式体验
2025-05-26 15:10:44
本田大幅削减电动汽车投资，将重点转向混合动力汽车及柔性制造
2025-05-26 14:29:29
骆歆 Rita 领衔！《剑侠情缘?零》明星主播天团助阵公测
2025-05-26 14:28:30
谷歌推出 250 美元的 AI Ultra 套餐，重新定义“高端”
2025-05-26 14:25:26

推荐