刚刚,Stable Diffusion 3.5重磅开源,文生图模型霸主归来!
著名大模型开源平台Stability AI,开源了超强文生图模型——Stable Diffusion3.5。
Stable Diffusion3.5一共有Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。
开源地址:https://huggingface.co/stabilityai
Github:https://github.com/Stability-AI/sd3.5
今年6月Stability AI首次开源了Stable Diffusion3Medium,但效果未达到预期,在听取了社区用户的反馈后,Stability AI花费大量时间进一步开发,便有了最新的3.5版本。
Large、Turbo、Medium简单介绍
在这次发布中,Stable Diffusion3.5提供了多种模型,以满足不同用户群体的需求。Stable Diffusion3.5Large模型拥有80亿参数,提供了卓越的图片质量和高度文本语义还原,是Stable Diffusion家族中最强大的模型,非常适合专业使用,尤其是在100万像素分辨率的图片。
而Stable Diffusion3.5Large Turbo模型则是一个蒸馏版本,它能够在仅仅4步之内生成高质量的图像,并且对提示的遵循性非常好,速度比Stable Diffusion3.5Large快得多。
Stable Diffusion3.5Medium模型将在10月29日发布,这个模型有25亿参数,采用了改进的MMDiT-X架构和训练方法,能在消费级硬件上即开即用,可生成0.25—200万像素之间生成图像,兼顾了质量和易定制性。
在开发这些模型的过程中,Stability AI优先考虑了可定制性,提供了一个灵活的基础来构建。
将Query-Key归一化集成到了变换器块中,这不仅稳定了模型训练过程,还简化了进一步的微调和开发。
为了支持这种下游的灵活性,Stability AI不得不做出一些权衡,例如,同一个提示使用不同种子可能会产生更大的输出变化,这是有意为之的,以帮助在基础模型中保留更广泛的知识库和多样化的风格。
此外,Stable Diffusion3.5在可定制性、高效的性能以及多样化的输出方面表现出色,使其成为市场上最可定制和最易访问的文生图像模型之一,同时在提示遵循性和图像质量方面保持了顶级性能。
OpenAI为ChatGPT加入记忆功能!可以记住你的提问内容啦
2月14日凌晨,OpenAI在官网宣布,正在测试ChatGPT记住用户提问内容的能力,同时可以自由控制其内存。该功能使用户不必频繁地提问相同的内容,ChatGPT都将记住那些内容并对长对话、个性化聊天等,例如,写长文小说;长期健康追踪;个性化编程习惯等,起到巨大帮助。自定义GPTs也支持该功能。目前,部分免费和Plus用户可以使用该功能,未来,OpenAI将进行更大的测试范围。站长网2024-02-14 09:37:060000起猛了,腾讯元宝接入DeepSeek了。
今天本来是想摸鱼一天不发文章了。结果早上睡醒,准备更新一下应用商店,看到了一个让我觉得非常离谱的更新预览。啊???这剧情,怎么感觉有点牛头人了???立刻第一时间去找了我元宝的朋友,也确认,是真的。这应该是我知道的第一家有自己大模型的大厂,第一次在面向C端的AI助手应用中,第一次接入DeepSeekR1。0001去哪儿员工每周有2天可灵活办公 7月15日正式实施
今日,去哪儿网CEO陈刚在一封内部信中宣布,自7月15日起,公司将正式实施混合办公模式。根据这一新的工作安排,员工每周三和周五可以自由选择工作地点,无论是办公室还是远程工作,都无需经过繁琐的申请审批流程。据悉,这一混合办公政策主要面向在去哪儿网工作满6个月的正式员工。公司去年10月启动了为期9个月的混合办公试点,收集到的反馈非常积极。站长网2024-07-09 17:20:340000AI语音公司ElevenLabs B轮融资8000万美元,估值超10亿美元
划重点:🗣ElevenLabs完成8000万美元B轮融资,由AndreessenHorowitz、NatFriedman等领投。🤖ElevenLabs是一家开发AI语音合成工具的初创公司,该轮融资将用于产品开发、扩展基础设施和团队、AI研究以及加强安全措施。💼公司计划通过改进检测工具、与分发平台合作等方式提高AI语音技术的责任和道德发展水平。站长网2024-01-22 16:29:330000AI视野:百度将发布AI互动式新搜索;OpenAI计划重磅更新;Character.AI推出AI群聊功能;谷歌人机验证已经拦不住AI
🤖📱💼AI应用百度将发布AI互动式新搜索百度世界2023即将发布AI互动式新搜索,具备听、会、看的能力,通过大模型和多轮交互提供个性化搜索体验。【AiBase提要】🔍百度新搜索整合语义检索技术和大语言模型,具备听、会、看能力。🔌百度建设AI新生态,吸引2万家开发者入驻插件平台,扩展大模型应用生态。站长网2023-10-12 15:43:490000