谷歌发布 MediaPipe Diffusion 插件 推理效率比ControlNet高20倍以上
谷歌最近发布了 MediaPipe Diffusion 插件,这是一个可在移动设备上运行的低成本可控文本到图像生成解决方案。该插件可以提取条件图像中的特征,并将其注入到扩散模型的编码器中,以实现对图像生成过程的控制。
与 ControlNet 相比,MediaPipe Diffusion 插件的推理效率提高了20 倍,在 v100上运行甚至可以提速高达100倍。
扩散模型是一种在文本到图像生成中取得成功的方法,它通过迭代去噪的方式逐步生成目标概念的图像。通过将文本提示作为条件,可以大大提高图像生成的效果。然而,仅凭文本来控制图像的生成往往难以获得理想的结果,例如具体的人物姿势和面部表情。
为了解决这个问题,谷歌研究人员设计了 MediaPipe Diffusion 插件,该插件是一个轻量级的模型,具有600万参数,使用 MobileNetv2中的深度卷积和反向瓶颈实现快速推理。
插件可以连接到预训练的文本到图像生成模型中,并提供额外的条件信号,从而实现对图像生成过程的控制。
研究人员还开发了基于扩散的文本到图像生成模型与不同插件的应用示例,包括人脸标记、全身标记、深度图和 Canny 边缘。通过调节插件的参数,可以生成不同风格和特征的图像。
对于 face landmark 插件,研究人员进行了定量评估,并与 ControlNet 进行了比较。实验结果表明,插件生成的样本质量比基础模型好得多,而推理时间只增加了2.6%。此外,在移动设备上的性能测试中,MediaPipe 插件表现出明显的优势。
总之,谷歌的 MediaPipe Diffusion 插件是一个可在移动设备上运行的图像生成控制模型,可以提高推理效率并实现对图像生成过程的精确控制。这将为移动端应用提供更灵活和定制化的生成式 AI 能力。
抖音:重点打击“传授‘无底线博流量’技巧”相关内容
抖音发布《关于打击“传授‘无底线博流量’技巧”相关内容的公告》称,即日起将开展“传授‘无底线博流量’技巧”相关内容的治理,重点打击传授违法违规“流量密码”的内容及账号。抖音表示,平台近期在治理“无底线博流量”行为时发现,有部分账号利用普通用户与平台规则之间的信息壁垒,通过夸大效果、制造焦虑等手段,曲解平台规则、传递虚假平台信息,传授违法违规的所谓“运营账号的小技巧”。站长网2024-06-06 14:11:060000周鸿祎:“元宇宙”概念明年可能会东山再起
快科技2月23日消息,据媒体报道,360创始人周鸿祎表示,受到OpenAI推出Sora影响,元宇宙概念在明年可能会东山再起。周鸿祎认为有三样东西会对元宇宙的发展由巨大作用,第一是头显设备,包括苹果推出的VisionPro;第二是AIGC的发展能产生更多3D内容;第三是用AI做3D建模,此后再做渲染。0000大模型纸上谈兵,WPS AI一战终结
轰轰烈烈的大模型热,开始降温了。国外,ChatGPT访问量自1月以来逐月下降,其它人工智能聊天机器人网站的流量和用户数量甚至出现负增长趋势。国内,各种在二级市场平地起飞的大模型概念股,股价出现大幅回撤。就在市场对星辰大海式的大模型宣言感到审美疲劳时,一款可落地、能提效的大模型产品站出来了。站长网2023-07-10 18:31:480000Instagram 推出定制AI贴纸和滤镜 功能强化创作者体验
Instagram近日推出一系列新功能,进一步优化创作者在平台上的体验。最引人瞩目的就是支持用户利用AI技术为故事和短视频制作定制贴纸的新功能。图片来源:Instagram通过Meta自主研发的图像分割AI模型,用户可以选择图片中的任意物体生成贴纸。操作过程与苹果iOS16中推出的图像剪切功能类似,用户可以手动调整剪切范围。制作完成后,定制贴纸可以在发布内容时使用。站长网2023-11-16 11:32:450000拼多多在微信的“隐秘生意”,年成交额已超千亿?
在公域流量难寻增长、平台与品牌发力私域的当下,活跃在团购群里的“团长”,如今越来越成了“香饽饽”。来自各个渠道、手握供应链资源的老板们都渴望与“团长”获得联系。社交平台上,只要是“团长”的留言,下边总有一串长长的供应商的留言。杭州电商社群快团联盟的创始人老张是从2021年开始感受到这种趋势的。站长网2023-08-13 09:30:490000