Hugging Face文生成图模型aMUSEd 几秒钟内就能生成AI图像
划重点:
🔍 Hugging Face 推出的 aMUSEd 模型可以在几秒钟内生成图像,比其他竞争对手如 Stable Diffusion 更快。
🔍 aMUSEd 使用了一种轻量级的文本到图像模型,基于 Google 的 MUSE 模型。
🔍 aMUSEd 采用了 Masked Image Model (MIM) 架构,这种架构减少了推理步骤,提高了生成速度和可解释性。
AI 图像生成模型的一个最大问题就是速度:使用 ChatGPT 或 Stable Diffusion 生成一张图像可能需要几分钟的时间。甚至 Meta 首席执行官马克・扎克伯格在去年的 Meta Connect 大会上也抱怨了图像生成速度。
Hugging Face 团队正试图通过一款名为 aMUSEd 的新模型加快速度,该模型可以在短短几秒钟内生成图像。
这款轻量级的文本到图像模型基于谷歌的 MUSE 模型,参数规模约为8亿。aMUSEd 可以部署在移动设备等设备上。它的速度来自于它的构建方式。aMUSEd 采用了一种称为 Masked Image Model (MIM) 的架构,而不是 Stable Diffusion 和其他图像生成模型中的潜在扩散。
Hugging Face 团队表示,MIM 减少了推理步骤,从而提高了模型的生成速度和可解释性。而且它的小尺寸也使得它运行速度很快。
aMUSEd项目体验网址:https://top.aibase.com/tool/aamused
你可以通过 Hugging Face 上的演示来尝试 aMUSEd。该模型目前以研究预览版的形式提供,但使用 OpenRAIL 许可证,意味着可以进行实验或调整,同时也对商业适应性友好。
aMUSEd 生成的图像质量可以进一步提高,团队也公开承认了这一点,选择发布它以 “鼓励社区探索像 MIM 这样的非扩散框架用于图像生成”。
aMUSEd 模型可以进行零样本的图像修复,而 Stable Diffusion XL 无法做到,这是 Hugging Face 团队的说法。
关于如何在几秒钟内生成 AI 图像,aMUSEd 中的 MIM 方法类似于语言建模中使用的技术,将数据的某些部分隐藏(或屏蔽),模型学习预测这些隐藏部分。在 aMUSEd 的情况下,隐藏的是图像而不是文本。
在训练模型时,Hugging Face 团队使用一种名为 VQGAN(Vector Quantized Generative Adversarial Network)的工具,将输入图像转换为一系列标记。然后部分屏蔽图像标记,模型通过文本编码器基于未屏蔽部分和提示来预测屏蔽部分。在推理过程中,文本提示通过相同的文本编码器转换为模型理解的格式。aMUSEd 从一组随机屏蔽的标记开始,逐步完善图像。
在每一次完善过程中,模型预测图像的部分,保留其最自信的部分,并继续完善其余部分。经过一定步骤后,模型的预测通过 VQGAN 解码器处理,生成最终的图像。
aMUSEd 还可以在自定义数据集上进行微调。Hugging Face 展示了使用8位 Adam 优化器和 float16精度微调的模型,该过程使用了不到11GB 的 GPU VRAM。
可以在这里访问模型微调的训练脚本:
https://github.com/huggingface/diffusers/blob/main/examples/amused/train_amused.py
OpenAI首席执行官将在国会山与美国众议院议长会面
划重点:-🤝**CEO与众议院议长对话:**OpenAI首席执行官SamAltman将在国会山与美国众议院共和党议长MikeJohnson进行会面。-🏛️**AI监管压力:**OpenAI成立了一个由微软支持的ChatGPT,并面临AI监管的压力,美国国会一直在讨论AI的相关规定。0000Sensor Tower 宣布收购聚合数据 AI 平台 data.ai
移动应用&手游情报平台SensorTower宣布,已完成收购聚合数据AI公司data.ai(原名AppAnnie)。这次收购对SensorTower意义重大,将扩大客户群、产品矩阵和全球影响力。SensorTower是数字经济领域的领先数据供应商,这次战略收购将进一步巩固其领先地位。站长网2024-03-19 10:07:160000椰树集团停播近90天 客服:复播时间暂不确定
11月5日消息,据媒体报道,有网友发现,椰树相关直播间已多日未开播。第三方数据平台显示,椰树集团”账号近90天未开播,椰树直播开心号”上次直播时间为8月26日。对此,椰树直播开心号”关联店铺客服回应称,复播的时间暂时还不确定。公开报道显示,近几年,椰树集团多次因另类营销冲上热搜,有几次被处以罚款,原因大多绕不开被质疑低俗广告、争议宣传。0000美图:影像和AIGC结合将带来生产力大爆发
今日,美图公司创始人兼首席执行官吴欣鸿发表主题演讲称,影像和AIGC的创新结合,将带来影像生产力的大爆发,同时会为相关领域带来新的职业和新的创业机会。吴欣鸿认为,AIGC将进一步降低影像内容创作的门槛,人人都可以是AI模型师,社交平台很多创作者已经通过AIGC获取受益。此外,AI正带来全新影像职业如AI剪辑师、AI标注师等等。站长网2023-05-08 17:08:440000亚马逊宣布向Claude 母公司Anthropic投资高达40亿美金
据路透社报道,亚马逊宣布将向人工智能初创公司Anthropic投资高达40亿美元,以加强与竞争对手在云计算领域的竞争。作为交易的一部分,亚马逊的员工和云客户将尽早获得Anthropic的技术,并将其整合到自己的业务中。站长网2023-09-25 16:02:180001