首页站长资讯谷歌发布 MediaPipe Diffusion 插件推理效率比ControlNet高20倍以上

谷歌发布 MediaPipe Diffusion 插件推理效率比ControlNet高20倍以上

站长网2023-07-13 09:09:073阅

谷歌最近发布了 MediaPipe Diffusion 插件，这是一个可在移动设备上运行的低成本可控文本到图像生成解决方案。该插件可以提取条件图像中的特征，并将其注入到扩散模型的编码器中，以实现对图像生成过程的控制。

与 ControlNet 相比，MediaPipe Diffusion 插件的推理效率提高了20 倍，在 v100上运行甚至可以提速高达100倍。

扩散模型是一种在文本到图像生成中取得成功的方法，它通过迭代去噪的方式逐步生成目标概念的图像。通过将文本提示作为条件，可以大大提高图像生成的效果。然而，仅凭文本来控制图像的生成往往难以获得理想的结果，例如具体的人物姿势和面部表情。

为了解决这个问题，谷歌研究人员设计了 MediaPipe Diffusion 插件，该插件是一个轻量级的模型，具有600万参数，使用 MobileNetv2中的深度卷积和反向瓶颈实现快速推理。

插件可以连接到预训练的文本到图像生成模型中，并提供额外的条件信号，从而实现对图像生成过程的控制。

研究人员还开发了基于扩散的文本到图像生成模型与不同插件的应用示例，包括人脸标记、全身标记、深度图和 Canny 边缘。通过调节插件的参数，可以生成不同风格和特征的图像。

对于 face landmark 插件，研究人员进行了定量评估，并与 ControlNet 进行了比较。实验结果表明，插件生成的样本质量比基础模型好得多，而推理时间只增加了2.6%。此外，在移动设备上的性能测试中，MediaPipe 插件表现出明显的优势。

总之，谷歌的 MediaPipe Diffusion 插件是一个可在移动设备上运行的图像生成控制模型，可以提高推理效率并实现对图像生成过程的精确控制。这将为移动端应用提供更灵活和定制化的生成式 AI 能力。

谷歌发布MediaPipeDiffusion插件 推理效率比ControlNet高20倍以上

0003

评论列表

共(0)条

相关推荐

站长资讯
法拉第未来两天暴涨超1000% 股价从6分涨到7毛
据最新数据，法拉第未来的股价在短短四个交易日内，累计涨幅高达惊人的1619%，收盘价定格在0.7050美元，单日涨幅更是达到了147.37%。
站长网2024-05-16 09:36:13
0000
站长资讯
小冰首批网红“GPT克隆人”来了！包月30元就能和AI半藏森林视频通话
快科技6月2日消息，日前，小冰公司宣布首批网红GPT克隆人”上线，其中包括百万粉丝网红博主半藏森林”。小冰公司表示，计划每周四解锁新的克隆人，相信在严格遵守法律的红线前提下，每个人都可拥有用AI克隆人开启第二人生的机会。快科技了解到，以半藏森林为例，目前提供42冰花/月（6元）、210冰花/月(30元)两种付费模式。
站长网2023-06-03 15:40:27
0000
站长资讯
特斯拉FSD 12.3 Beta今日更新马斯克：将是一次“重大发布”
快科技3月13日消息，据媒体报道，特斯拉今日正式开启了FSDV12.3测试版的软件升级。虽然此次升级并未发布有关内容的说明，但是马斯克却表示，此次升级相当是一次大版本更新的重大发布。据了解，此次升级引入了马斯克一直引以为傲的端到端神经网络”。该网络上车后，将意味着特斯拉的操控逻辑已经转变为了神经网络进行处理，而该技术也被称为是改变游戏规则的技术。”
站长网2024-03-13 15:42:59
0000
站长资讯
虎牙直播APP在苹果应用商店下架
据网友反馈，苹果AppStore中已无法搜索到虎牙App，不过，在小米、华为手机应用商店进行搜索，发现虎牙直播可正常搜索并下载。数据显示，2022年虎牙总收入为92.2亿元，归属于虎牙的净亏损为4.867亿元，全年虎牙直播移动端MAU（月均活跃用户数）达8430万，同比增长4.2%。
站长网2023-04-23 11:59:33
0000
站长资讯
不止华为智界：曝蔚来对已下定小米SU7的消费者补贴5000元
快科技4月23日消息，这两天，有不少截胡”小米SU7定单的消息传出。最先引起关注的是智界汽车，有传闻称现购买任意一款智界S7，付完尾款将直接在车价上抵扣小米SU7锁单不可退的5000元定金，在接受采访时，鸿蒙智行门店工作人员确认了此事。
站长网2024-04-23 16:37:06
0000