谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征
划重点:
- 💡 SynCLR是一种新颖的人工智能方法,通过合成图像和合成字幕,实现对视觉表征的学习,无需使用真实数据。
- 💡 该方法通过三个阶段实现,包括合成图片字幕、生成合成图像和字幕,以及训练视觉表征模型。
- 💡 研究结果表明,SynCLR在图像分类、细粒度分类和语义分割等任务上表现出色,显示了利用合成数据训练强大AI模型的潜力。
近期,Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。
SynCLR的工作原理
研究团队首先提出了一个三阶段的方法。首先,在“合成图片字幕”阶段,他们采用大型语言模型的上下文学习能力,通过单词到字幕的转换示例,生成了大量的图片字幕。接着,在“生成合成图像和字幕”阶段,利用文本到图像扩散模型,生成了包含6亿张合成图片的数据集。最后,在“训练视觉表征模型”阶段,研究团队使用了掩蔽图像建模和多正对比学习,训练模型从合成数据中学到有意义的表征。
实验结果
研究结果表明,SynCLR在多个任务上取得了令人瞩目的成绩。通过与现有模型如CLIP和DINO v2进行比较,SynCLR在ImageNet-1K上的线性探测准确率以及细粒度分类和ADE20k上的语义分割任务上都表现出色。特别值得一提的是,SynCLR在以字幕为级别的细粒度上的优越性,为模型的可扩展性和在线类别增强提供了便利。
尽管SynCLR在合成数据上展现出了强大的性能,研究团队也提出了一些改进方向。其中包括使用更复杂的大型语言模型、优化不同概念之间的样本比例、探索高分辨率训练阶段等。这些改进有望进一步提升合成数据在训练人工智能模型中的效果。
项目网址:https://github.com/google-research/syn-rep-learn
论文网址:https://arxiv.org/pdf/2312.17742.pdf
曹书乐:尝试理解青少年的短视频使用动机,呼吁多元主体共治
中国青年网北京5月22日电(记者牟昊琨实习记者任馨蕾)近年来,在抖音等平台刷短视频已经成了大家茶余饭后常做的事,而短视频的内容五花八门。5月18日,在由中国社会科学院新闻与传播研究所主办的“短视频与青少年发展”研讨会上,清华大学新闻与传播学院副教授曹书乐表示,“媒介无处不在,我们应跨越媒介恐慌的视角,正视媒介对个体和社会的各方面影响”。0001盒马CEO侯毅正式退休 CFO严筱磊将兼任CEO
据晚点LatePost报道,阿里巴巴集团宣布盒马创始人侯毅将卸任CEO并退休,由盒马CFO严筱磊接任CEO。侯毅是零售业的老将,曾在多家公司担任要职,2015年加入阿里创建盒马,并取得一定成就。盒马在短短9年内成长为全国生鲜连锁品牌,但尚未实现整体盈利。盒马仍在寻求引入新的战略投资方。站长网2024-03-18 22:58:310000播放量破50亿,“南方小土豆”挤爆哈尔滨
“哈尔滨冰雪大世界”无疑是这个冬天最为火爆的旅游景点,这中间以抖音为代表的短视频平台起到了极大的宣传推动作用。在数量众多的短视频安利下,不管是“南方小土豆”还是“北方大地瓜”,都产生了要去这个冰雪之都一探究竟的冲动。令人遗憾的是,伴随着大世界开园而来的除了掌声,而是质疑。0000谷歌与Reddit达成6千万美元交易,共同推动AI培训计划
**划重点:**1.💼Reddit与谷歌合作,签署了一份价值6千万美元的协议,允许谷歌利用Reddit用户生成的内容培训其人工智能模型。2.📈这项交易被认为是Reddit为上市做准备的一部分,可能为其带来财务助益。3.🌐此次合作引发了对人工智能公司如何使用和从用户生成内容中获利的担忧,同时涉及到了类似的数据许可交易趋势。站长网2024-02-23 18:11:430000百度营销发布 AI Native 营销平台“轻舸”
9月7日,百度营销发布全球首个AINative营销平台“轻舸”,通过生成式AI贯通营销方案表达和广告投放优化,预期可以将广告投放转化率提升超20%。轻舸可以实现“自由表达”。通过自然语言交流,轻舸可以用一个Prompt提示词直接传达需求,“无衰减”传达企业营销策略,让商家的优质信息和服务直接连接到所需的目标人群。站长网2023-09-09 10:09:260000