谷歌Deepmind发布最先进的图像生成模型Imagen 2

站长网2023-12-14 09:54:460阅

谷歌Deepmind宣布了他们最先进的图像生成模型Imagen2。该模型通过参考图片和文本生成新图片和局部编辑的效果比较强大。

这一最新模型的主要特点包括改进的图像描述理解。为了帮助创建更高质量和更准确的图像，Imagen2的训练数据集中添加了更多描述，帮助该模型学习不同的标题风格，并更好地理解广泛的用户提示。

地址:https://deepmind.google/technologies/imagen-2/

此外，Imagen2的数据集和模型在许多领域取得了改进，这些领域通常是文本到图像工具所困扰的，包括渲染逼真的手部和人脸，以及保持图像不受干扰的视觉伪影，从而实现更加真实的图像生成。

Imagen2的扩散技术提供了高度的灵活性，使得更容易控制和调整图像的风格。通过提供参考风格图像并结合文本提示，可以训练Imagen2生成遵循相同风格的新图像。

该模型还支持图像编辑功能，如“修补”和“扩展”。通过提供参考图像和图像蒙版，用户可以使用一种称为修补的技术直接在原始图像中生成新内容，或者使用扩展技术将原始图像延伸到其边界之外。

为了应对潜在的风险和挑战，Google DeepMind在设计和开发过程中设置了严格的防护措施。Imagen2集成了SynthID，这是一种先进的数字水印工具，使Google Cloud客户能够在图像的像素中添加不可察觉的数字水印，而不会影响图像质量。这种数字水印可以在应用修改，如滤镜、裁剪或使用有损压缩方案保存后仍然可检测到。在发布功能给用户之前，Google DeepMind进行了严格的安全测试，以最小化潜在的危害风险。安全检查涵盖了训练数据、输入提示和系统生成的输出，以避免生成潜在有问题的内容。

现在，开发人员和云客户可以通过Google Cloud Vertex AI中的Imagen API使用这一先进的图像生成模型。

谷歌Deepmind发布最先进的图像生成模型Imagen2

0000

评论列表

共(0)条

相关推荐

站长资讯
194亿元增长3.7％！小米公布618交易额
如今的双11、618都越来越低调，电商平台不再发布详细交易额战报，各大厂商或者沉默，或者只给出一些模糊的增长比例。只有小米，大大方方地公布了618战绩：全渠道累计支付金额超过194亿元！但是，相比去年的187亿元，只增长了区区3.7％，200亿大关都没能跨过去，足可见当下的行业有多么艰难。
站长网2023-06-20 11:54:24
0000
站长资讯
阿里巴巴CEO吴泳铭：AI技术将为社会带来深远变革
在2023年世界互联网大会乌镇峰会上，阿里巴巴集团首席执行官吴泳铭强调，AI技术将为社会带来深远变革，超越信息革命的范畴，涉及整个知识迭代和社会协同方式的改变。他指出，人类历史上的科技发展加速始于语言文字和印刷术的发明，类比于计算机语言和硬盘存储，AI技术让机器理解人类语言和逻辑，携带巨大算力，帮助人类理解知识，推动协同流式驱动的发展，其加速度将远超想象。
站长网2023-11-09 10:36:51
0000
站长资讯
“趁他病要他命”！揭秘扎克伯格“60天内打败马斯克”计划
凤凰网科技讯北京时间7月31日消息，去年11月，埃隆马斯克（ElonMusk）收购推特(现已更名为X)后制造的一系列混乱，让死对头马克扎克伯格(MarkZuckerberg)嗅到了机会。一场争分夺秒开发“X杀手”的竞赛开始了。马斯克露破绽
站长网2023-07-31 11:08:58
0000
站长资讯
网易申请“网易玉言”大模型商标
天眼查App显示，7月18日，网之易信息技术（北京）有限公司申请注册“网易玉言”商标，国际分类为网站服务，当前商标进度为申请中。据悉，“玉言”是网易伏羲实验室推出的中文预训练大模型，“玉言”大模型参数达到110亿，结构由深层Encoder和浅层Decoder组成。
站长网2023-08-08 10:37:29
0000
心电测量“黑科技”亮相2023北京科技周
北京商报讯（记者姚倩）5月20日，第29届全国科技活动周主场活动暨北京科技周在北京启动。本届北京科技周以“热爱科学崇尚科学”为主题，围绕科技创新和科学普及，彰显聚力创新的北京科技力量，呈现和谐共生的美好城市生活。由百洋医药集团投资的创新企业北京五维康科技有限公司自主研发的十二导“飞碟心电仪”获得广泛关注。
站长网站长资讯2023-05-24 23:14:25
0000