阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣
阿里巴巴与中国科学技术大学联手推出了一款名为ViViD的新框架,旨在革新虚拟试衣体验。ViViD基于先进的扩散模型技术,能够实现视频中人物衣物的实时替换,从而生成自然且逼真的视频效果。
ViViD的推出解决了以往视频试衣中难以保持时间一致性和图像质量的难题。它由三大核心组件构成:服装编码器、姿势编码器以及时间模块。这些组件协同工作,不仅可以精确提取衣物细节的语义特征,还能对人物姿势进行编码,并确保整个视频在时间线上的连贯性。
为了进一步提升试衣效果,研究团队还引入了一种创新的注意力特征融合机制。这种机制优化了衣物语义信息的整合过程,使得最终呈现的试衣效果更加贴合用户的多样化需求。无论是上半身、下半身还是连衣裙等不同类型的服装,ViViD都能够轻松应对,展现出其强大的适应性。
视频来自官方项目页
在实验测试中,ViViD展现出了令人瞩目的性能。与其他现有方法相比,它在视觉质量、时间一致性以及细节保持方面都取得了显著优势。实际演示中,用户可以选择单独更换上衣或裤子,或者同时替换两者,这种灵活的选择极大地丰富了用户体验。
为了全面评估ViViD的性能,阿里和中科大的研究团队投入了大量资源构建了一个专门的数据集,命名为ViViD数据集。这个数据集包含了高达9700个服装视频对,分辨率高达832×624,是目前公开数据中规模最大、多样性最高且分辨率最清晰的视频虚拟试衣数据集。
ViViD的问世不仅是人工智能领域的一项技术突破,更是虚拟试衣技术迈向实用化的重要一步。随着这一新框架的推广和应用,未来消费者在线上购物时将能享受到更加便捷、直观的试衣新体验,为零售商和电商企业带来新的增长机遇。
项目页:https://top.aibase.com/tool/vivid
论文地址:https://arxiv.org/pdf/2405.11794
Midjourney推出Style Tuner工具 用户可训练自己的视觉风格模型
要点:1.Midjourney推出的新StyleTuner工具允许用户生成独特的视觉风格并应用于所有后续生成的图像,对品牌、企业和创作者具有重要意义。2.该工具取代了以前需要重复文本描述来实现一致风格的方法,为用户提供了多种风格选择,并生成风格代码,以保持一致的美学风格。站长网2023-11-03 10:27:230001斗鱼成立临时管委会 负责管理公司运营工作
斗鱼今天宣布,公司董事会于2023年11月24日成立了一个临时管理委员会,该委员会由公司董事兼首席战略官苏明明先生、公司董事兼副总裁曹浩先生和公司副总裁任思敏女士组成。临时管理委员会的成立是在2023年11月22日成都警方发布公告确认公司首席执行官兼董事长陈少杰被逮捕后进行的。临时管理委员会将负责管理公司的运营工作,直至进一步通知。站长网2023-11-28 17:13:250000AI智能硬件公司「未来智能」获数千万元Pre-A轮融资
据36氪报道,近日,安徽艾德未来智能科技有限公司(未来智能)宣布完成数千万元Pre-A轮融资,由天际资本领投。本轮融资资金将主要用于AI创新产品研发和市场扩张。他们的主打产品是iFLYBUDS系列会议办公耳机,可以在打电话、路演等场景中快速启动录音功能。该产品适配系统通话、网络电话以及市面上主流的会议APP,并支持边录音边转文字、外语实时翻译等多种功能。站长网2023-09-07 14:30:330000元乘象ChatImg大模型完成千万元天使轮融资
近日,多模态大模型初创企业“智子引擎”宣布完成千万元天使轮融资,旗下拥有参数规模约150亿的大模型“元乘象ChatImg”,关注微信公众号“元乘象”即可体验。该模型的训练集主要包括图文对数据和视觉问答(VQA)数据,已经在图文匹配、图文检索、图像描述生成和文本描述生成等多个任务上进行了训练,表现出了出色的多模态处理能力。站长网2023-05-23 11:17:010000最挤五一档,没带火电影院
五一小长假第一天,到处人挤人,不过电影院没那么热闹。观众小莉五一假期不想出游看人,就想趁机好好休息,和朋友逛街看电影。即便是逛完街后临时买票,她发现“大部分场次都有不少位置,连最佳观影区都没有坐满。”0001