DeepMind研究人员发现,深度学习模型在图像和音频压缩方面表现出色
文章概要:
1. DeepMind研究人员发现,深度学习模型在文本领域之外,出人意料地在图像和音频数据的压缩方面表现出色。
2. 研究发现,虽然主要训练于文本数据,但这些大型语言模型(LLMs)在图像和音频数据的压缩方面表现出令人瞩目的性能,甚至超过了专门的压缩算法。
3. 将LLMs从压缩的角度看待为数据压缩器,为评估模型性能和规模提供了新的洞察,对模型的大小和性能之间的关系提供了重要见解。
近日,Google旗下的人工智能子公司DeepMind发布的一项研究表明,大型语言模型(LLMs)除了在文本数据处理方面表现出色之外,还具备出色的图像和音频数据压缩能力。这一发现为重新审视LLMs的潜力提供了新的角度。
研究的核心观点是将LLMs视为强大的数据压缩器,而非仅仅是文本生成模型。研究作者提出“通过压缩的角度来看待预测问题”,这为我们理解这些模型的能力带来了全新的视角。

在研究中,DeepMind的研究人员对LLMs进行了一些微小的修改,使其能够执行算术编码,这是一种无损压缩算法。值得注意的是,LLMs的训练过程是基于对文本序列的极大概率和交叉熵的最小化,这使得它们能够生成概率分布,与数据压缩之间存在一对一的等价关系。这种无损压缩算法,如gzip,可以从压缩的数据完美重构原始数据,确保不丢失任何信息。
研究人员对LLMs在文本、图像和音频数据上的压缩能力进行了评估。不出所料,LLMs在文本压缩方面表现出色。例如,Chinchilla模型(拥有700亿参数)将数据压缩到原始大小的8.3%,远远超过gzip和LZMA2,它们分别只能实现32.3%和23%的压缩率。
然而,更引人注目的发现是,尽管LLMs主要在文本数据上进行训练,但它们在图像和音频数据的压缩方面也取得了显著的成功,超过了领域专用的压缩算法,如PNG和FLAC。
尽管取得了令人鼓舞的结果,但与现有的压缩模型相比,LLMs在实际数据压缩中并不实用。这是因为LLMs的体积较大,运行速度较慢。例如,研究人员发现,gzip可以在CPU上在不到一分钟内将1GB的文本数据压缩,而具有320万参数的LLM需要一个小时才能完成相同数量数据的压缩。
研究还发现,LLMs的规模对其性能有重要影响。虽然一直以来,人们普遍认为越大的LLMs性能越好,但研究人员发现,对于较小的数据集,更大的模型并不一定更好。这表明LLMs的性能与数据集的大小有关,压缩率可以作为评估模型对数据集信息学习的指标。
智能视频总结工具BibiGPT 快速提取关键信息
BibiGPT是一款基于人工智能的视频总结工具,通过先进的语言模型和自然语言处理技术,能够自动提取视频和音频的关键信息,生成简洁而准确的摘要。用户只需复制粘贴视频链接或上传本地文件即可获得总结。体验地址:https://bibigpt.co/站长网2023-11-10 17:21:370001雷军模仿者“雷民”改名 已删除所有与模仿雷军相关视频
站长之家(ChinaZ.com)5月20日消息:一个曾经以模仿雷军而备受关注的账号“雷民”,近日该账号已正式更名为“民子”,并删除了所有与模仿雷军相关的视频内容。自5月2日起,“雷民”的短视频便以高度还原雷军形象为特色,从衣着到发型,再到神态,都努力呈现出与雷军本人极高的相似度。其中一条视频的背景音乐更是选用了雷军的经典“Areyouok?”,让人忍俊不禁。站长网2024-05-20 10:39:170000Claude iOS版本突然推出!11MB大小,体验丝滑,网友呼吁语音功能快上线
Claude,深夜突然大放送iOS版本!就在几小时前,Anthropic官方突然给家人们送福利,官宣Claude正式推出iOSAPP,只有11MB。如此一来,可真像其官方说得那样:“前沿情报的力量,现在就在你的口袋里。”虽然Claude的手机版本上线显得有些姗姗来迟——去年5月,其最大劲敌OpenAI就推出了iOSAPP,但大多数用户们显然还是很开心这一操作。站长网2024-05-04 12:36:230000Google Performance Max推生成式AI广告工具 商家轻松创建高质量广告内容
划重点:-Google推出新的AI生成工具,可用于广告制作,包括标题、描述和图像。-广告代理和没有内部创意团队的企业都可以利用这一工具,通过文本提示不断迭代生成广告内容。-Google承诺不会生成相同的图像,以避免竞争对手使用相同的广告元素。站长网2023-11-08 09:56:580000斯坦福研究发现全球最大AI模型Llama 2缺乏透明度
🔍划重点:1.斯坦福大学发布的“基础模型透明度指数”揭示,包括Meta在内的顶级AI模型开发者未能提供足够关于其对社会潜在影响的信息。2.Meta的Llama2在透明度方面表现最佳,但即使如此,十大最受欢迎的模型中仍有10个透明度不足。3.研究人员认为透明度是一个广泛的概念,他们根据100个指标评估模型的构建方式、运作原理以及人们如何使用它们来定义透明度。站长网2023-10-19 10:12:560000