Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0
今天,Stability AI宣布推出Stable Diffusion XL1.0,这是一款文本到图像的模型,该公司称之为迄今为止“最先进”的版本。除了Stability的API和消费者应用ClipDrop和DreamStudio之外,Stable Diffusion XL1.0还在GitHub上以开源的形式提供,Stability声称,与其前身相比,Stable Diffusion XL1.0提供了“更鲜艳”和“准确”的颜色,以及更好的对比度、阴影和光照效果。
在接受TechCrunch采访时,Stability AI的应用机器学习负责人Joe Penna指出,Stable Diffusion XL1.0包含了35亿个参数,可以在多种纵横比下“在几秒钟内”产生全1兆像素分辨率的图像。“参数”是模型从训练数据中学习到的部分,基本上定义了模型在一个问题上的技能,在这里就是生成图像。
上一代Stable Diffusion模型,Stable Diffusion XL0.9,也可以产生更高分辨率的图像,但需要更多的计算力。
“Stable Diffusion XL1.0是可定制的,可以针对概念和风格进行微调。”Penna说。“它也更容易使用,能够通过基本的自然语言处理提示实现复杂的设计。”
Stable Diffusion XL1.0在文本生成方面也有所改进。虽然许多最好的文本到图像模型都难以生成带有清晰标志的图像,更不用说书法或字体了,但Penna说,Stable Diffusion XL1.0能够实现“先进”的文本生成和可读性。
此外,正如SiliconAngle和VentureBeat报道的那样,Stable Diffusion XL1.0还支持修复(重建图像缺失的部分)、扩展(扩展现有图像)和“图像到图像”提示——意味着用户可以输入一个图像,并添加一些文本提示来创建更详细的变化。而且,该模型能够理解复杂的、多部分的、用简短提示给出的指令,而之前的Stable Diffusion模型则需要更长的文本提示。
“我们希望通过发布这个更强大的开源模型,不仅图像的分辨率会增加四倍,而且还会带来一些巨大的进步,这将极大地惠及所有用户。”他补充说。
但是与之前版本的Stable Diffusion一样,该模型也引发了一些棘手的道德问题。
Stable Diffusion XL1.0的开源版本理论上可以被不法分子用来生成有毒或有害的内容,比如未经同意的换脸。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。
无数教程演示了如何使用Stability AI自己的工具,包括DreamStudio,一个为Stable Diffusion提供开源前端界面的工具来创建换脸。还有无数其他教程展示了如何微调基础的Stable Diffusion模型来生成色情内容。
Penna并没有否认滥用是可能发生的——并承认该模型也包含了某些偏见。但他补充说,Stability AI已经采取了“额外的步骤”来减少有害内容的生成,通过过滤模型的训练数据中的“不安全”图像,发布与有问题的提示相关的新警告,并尽可能地在工具中屏蔽单个有问题的术语。
Stable Diffusion XL1.0的训练集还包括了一些艺术家的作品,这些艺术家曾经抗议过包括Stability AI在内的一些公司使用他们的作品作为生成式人工智能模型的训练数据。Stability AI声称,它受到了美国公平使用原则的法律保护。但这并没有阻止一些艺术家和库存照片公司Getty Images提起诉讼,以阻止这种做法。
Stability AI与初创公司Spawning有合作关系,尊重这些艺术家的“退出”请求,表示它并没有从其训练数据集中删除所有被标记的艺术作品,但它“继续考虑艺术家的要求”。
茶百道上市:一年8亿杯,赚钱不靠卖奶茶
又一家不靠卖“奶茶”的奶茶小巨头,要上市了。8月15日晚,港交所网站显示,茶百道(四川百茶百道实业股份有限公司)正式提交IPO招股书。这个主打15元价位的茶饮连锁品牌,通过加盟模式在全国开出了七千多家店,2022年的收入为42亿元,其中超过40亿元,是向加盟商销售原料、包材等带来的收入。2022年,茶百道的净利润9.65亿元。这一年,它卖了近8亿杯奶茶,相当于每卖一杯茶平均净赚1.21元。站长网2023-08-17 09:31:420000金融分析多模态LLM FinTral:基于Mistral-7B模型 得分接近GPT-4
划重点:1.💡金融NLP领域的创新:FinTral采用多模态方法,处理文本、数字、表格和视觉数据,通过FinSet数据集展现卓越性能,超越GPT-4等模型。2.🌐模型特色:使用Mistral-7b模型为基础,经过领域特定的预训练、指导调整和AI反馈,结合视觉数据处理和工具检索,实现在金融分析中的精准和深度。站长网2024-02-29 11:32:420000Meta 高管Nick Clegg谈人工智能:绝对需要监管
Meta全球事务总裁尼克・克莱格(NickClegg)在接受YahooFinance采访时表示,人工智能必须受到监管,公司不能等待政府立法行动。他强调需要通过民主协商的法律框架来规范新技术,解决数据使用、版权和知识产权等复杂问题。在白宫会议上,Meta等科技巨头承诺采取自愿的保护措施,更好地管理人工智能带来的风险,并制定AI监管的基本框架。站长网2023-07-26 14:40:560000区块链百科全书IQ.wiki推出基于ChatGPT的搜索引擎“IQ GPT”
IQ.wiki是一个基于区块链的百科全书,现已推出基于OpenAI的ChatGPT技术的搜索引擎,以帮助加密货币用户搜索各种来源的信息。站长网2023-08-11 16:15:290000GLM技术团队宣布代码模型CodeGeeX2-6B开源
GLM技术团队宣布,「代码生成模型CodeGeeX2-6B」正式开源。CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于ChatGLM2架构注入代码实现。得益于ChatGLM2的更优性能,CodeGeeX2-6B在多项指标上取得了较大的性能提升。与150亿参数的StarCoder-15B相比,CodeGeeX2-6B凭借60亿参数便具备了近10%的优势。站长网2023-07-26 11:53:490000