Midjourney V6版本预计今年发布 将实现质量飞跃
文章概要:
1. Midjourney CEO David Holz承诺V6版本将带来更好的文本理解和图像生成,预计今年内发布。
2. Midjourney计划分两个阶段推出Web版本,首先是更新的网站,然后是带有图像生成和社交功能的版本。
3. Midjourney的路线图还包括3D和视频生成,Holz对3D生成特别乐观,认为它可以改善视频游戏图形。
Midjourney公司的CEO David Holz表示,他们的下一个版本也就是V6版本将带来一次质量飞跃。与之前的版本升级相比,Holz强调,从V5到V6的跨越将更为显著。虽然他没有透露确切的发布日期,但他表示肯定会在今年内发布。
V6版本的亮点之一是更好的文本理解和图像生成能力。Holz承诺,图像生成将更贴近提示内容,并更加注重措辞中的细节。
图源备注:图片由AI生成,图片授权服务商Midjourney
他还提到了文本渲染的可能性,尽管他表示这并不难,但团队迄今为止还没有将其视为重要功能。不过,他也指出,他尚未看到过出色的文本渲染示例,并且是否以及在何种程度上实现这一功能尚未确定。
在被问及OpenAI的DALL-E3时,Holz表示“非常乐观”,认为Midjourney将继续提供最高的图像质量。尽管初步显示DALL-E3在图像质量方面略有优势,但Midjourney更好地遵循提示并能够渲染文本。
除了图像生成,Midjourney还计划推出Web版本。这将分两个阶段进行,首先是现有网站的重新设计,然后是具备图像生成功能和社交功能的版本。Holz没有提供具体的时间表,直到最终版本的网站上线。
此外,Midjourney的路线图还包括3D和视频生成。Holz对3D生成特别表示乐观,认为它可以帮助改善视频游戏图形。他曾表示,他预计未来视频游戏将由生成而非渲染产生。然而,Midjourney并不计划在今年发布关于3D生成的具体信息或演示,对于视频生成也是如此。虽然团队正在研究这些功能,但Holz表示它们可能离3D生成市场成熟还有写距离。
Midjourney的版本6将成为一次令人期待的升级,带来更好的图像生成和文本理解能力。他们还计划推出Web版本,并在未来加强3D和视频生成。
iPhone从4000多米高空坠落仍可使用 甚至没有划痕
站长之家(ChinaZ.com)1月9日消息:美国当地时间1月6日,阿拉斯加航空公司1282号航班遭遇了一次空中惊魂。在俄勒冈州波特兰上空起飞几分钟后,一个机身组件意外分离,导致一扇窗户和部分侧壁消失,氧气面罩自动展开。美国国家运输安全委员会(NTSB)随即展开调查,并寻求公众帮助,寻找丢失的机身组件和其他可能被扔出飞机的物品。0002如果避免原图遭AI滥用?使用 AI 防止 AI 图像操纵
麻省理工学院的研究人员开发了一种名为PhotoGuard的技术,用于对抗未经授权的图像操纵,保护图像的真实性。PhotoGuard通过引入微小的、不可见的像素变化来破坏人工智能模型对图像进行操纵的能力。它使用了两种不同的攻击方法:编码器攻击和扩散攻击。编码器攻击对模型中图像的潜在表示进行微调,使模型将图像视为随机实体,从而阻止对图像的操纵。站长网2023-07-31 14:39:220000生成式 AI 安全标准发布,覆盖训练数据和生成内容
划重点:⭐中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等⭐标准要求细化了训练数据、生成内容和模型安全要求⭐中国连续出台安全管理条例,展示对创新技术重视,保障人工智能应用安全站长网2024-06-03 09:06:500000实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。另外,它还能在移动设备上进行实时渲染,编辑和调整头像的表情和姿势。项目地址:https://top.aibase.com/tool/bakedavatar站长网2024-01-09 14:55:450000Q3净赚170亿: 拼多多一骑绝尘
拼多多无对手?11月28日,继二季度业绩大超预期之后,拼多多(PDD.US)再度交出了一份营收688.4亿元,净利润170.3亿元的惊人财报。其中,拉动增长的板块主要为交易服务板块,该业务同比增幅超300%,营收接近300亿元。拼多多仅仅收取0.6%的佣金,在传统电商消费淡季的三季度,为何交易服务业务收入如此“逆天”?站长网2023-11-29 14:11:000000