谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征
划重点:
- 💡 SynCLR是一种新颖的人工智能方法,通过合成图像和合成字幕,实现对视觉表征的学习,无需使用真实数据。
- 💡 该方法通过三个阶段实现,包括合成图片字幕、生成合成图像和字幕,以及训练视觉表征模型。
- 💡 研究结果表明,SynCLR在图像分类、细粒度分类和语义分割等任务上表现出色,显示了利用合成数据训练强大AI模型的潜力。
近期,Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。
SynCLR的工作原理
研究团队首先提出了一个三阶段的方法。首先,在“合成图片字幕”阶段,他们采用大型语言模型的上下文学习能力,通过单词到字幕的转换示例,生成了大量的图片字幕。接着,在“生成合成图像和字幕”阶段,利用文本到图像扩散模型,生成了包含6亿张合成图片的数据集。最后,在“训练视觉表征模型”阶段,研究团队使用了掩蔽图像建模和多正对比学习,训练模型从合成数据中学到有意义的表征。
实验结果
研究结果表明,SynCLR在多个任务上取得了令人瞩目的成绩。通过与现有模型如CLIP和DINO v2进行比较,SynCLR在ImageNet-1K上的线性探测准确率以及细粒度分类和ADE20k上的语义分割任务上都表现出色。特别值得一提的是,SynCLR在以字幕为级别的细粒度上的优越性,为模型的可扩展性和在线类别增强提供了便利。
尽管SynCLR在合成数据上展现出了强大的性能,研究团队也提出了一些改进方向。其中包括使用更复杂的大型语言模型、优化不同概念之间的样本比例、探索高分辨率训练阶段等。这些改进有望进一步提升合成数据在训练人工智能模型中的效果。
项目网址:https://github.com/google-research/syn-rep-learn
论文网址:https://arxiv.org/pdf/2312.17742.pdf
中国航信与阿里云达成战略合作 推动大模型在航空旅游领域落地
在2023云栖大会上,中国民航信息网络股份有限公司与阿里云签署全面战略合作协议。未来,双方将发挥在各自领域的优势,推动大模型、云计算等技术在航空旅游领域落地,共同加速民航信息数智化建设进程。站长网2023-11-03 14:18:470000用AI让明星教你学英语,是一门好生意吗?
想象一下,好莱坞明星用一口流利的中文解释英语单词,是一种怎样的情景?B站UP主“johnhuu”用AI做到了。在这条时长1分半的视频中,《复仇者联盟》绯红女巫的饰演者结合美剧片段,用“中文”解释了同个英语单词在不同语境下闹出的笑话。截至目前,该视频在B站播放量达到396万。站长网2024-03-07 19:07:170001DINOv2:Meta AI 开源的自监督计算机视觉模型
MetaAIResearch发布了DINOv2开源项目,这是一款用于计算机视觉(CV)任务的基础模型。DINOv2在一个由1.42亿张图像构成的筛选数据集上进行了预训练,可用作图像分类、视频动作识别、语义分割和深度估计等多个任务的骨干模型。站长网2023-05-25 09:21:250000MIT研究人员利用人工智能识别可杀灭耐药细菌的抗生素
**划重点:**1.💡通过深度学习,MIT研究人员发现一类新型抗生素,可有效杀灭导致美国每年超过1万人死亡的耐药细菌。2.🌐利用人工智能的新型药物研发在医疗领域日益受到关注,MIT的研究提供了一个高效、资源有效的框架,为化学结构角度的药物研发提供机械洞察。站长网2023-12-22 10:16:040000微信回应校园支付费率问题:依然保持零费率优惠政策
昨日晚间,针对“校园支付费率”相关问题,微信支付回应称,外面都在传费率要调到千分之六是假消息。微信解释称,校园学杂费自始至终保持零费率优惠政策,相关变动从不涉及此类场景。自2015年以来,微信支付自始至终在校园非盈利场景采取零费率优惠政策,相关变动从不涉及此类场景,微信支付将继续对因此产生的通道及运营成本进行补贴。站长网2023-06-30 19:48:450000