百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入
站长网2024-01-19 10:23:400阅
百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。
项目地址:https://top.aibase.com/tool/univg
项目演示页面:https://univg-baidu.github.io/
视频生成技术基于“扩散”原理的方法近来在学术和产业界引起广泛关注,并取得显著成就。然而,目前这一领域主要集中在单一目标或单一任务的视频生成上,例如根据文本、图片或它们的组合生成视频。但这样的方法并不能完全满足真实世界多变的应用需求。用户通常需要更灵活的输入方式,如单独使用图像或文本,或将二者结合起来。
为了解决这一问题,百度提出了UniVG,一种“统一模态视频生成系统”,能够处理各种文本和图像的组合输入。该系统重新定义了视频生成模型中的多项任务,将它们划分为“高自由度生成”和“低自由度生成”两大类。在高自由度视频生成方面,采用了“多条件交叉注意力”技术,以生成与输入的图像或文本语义高度一致的视频。而在低自由度视频生成方面,引入了“偏置高斯噪声”,这种方法相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。
技术性能方面,UniVG在MSR-VTT视频数据库上表现出色,获得了最低的帧间视频差异性度量(Frame Video Distance, FVD)。这一成绩不仅超越了当前的开源方法,还与业界领先的闭源方法Gen2不相上下,显示出了卓越的实用价值和技术优势。
0000
评论列表
共(0)条相关推荐
具身智能,开启机器人纪元
时至8月,火热了半年之久的AI赛道,已俨然显示出了降温之势。可就在这个关头,由号称华为天才少年——稚晖君打造的人形AI机器人——「远征A1」却赫然登场,用一系列亮眼的特点,振奋了已显冷淡的AI赛场。舞台之上,这个迈着小碎步入场的机器人,引来了整个行业的关注。而这个由智元机器人(Agibot)发布的具身智能机器人,之所以能在业内引起如此大反响,则是因为其具备了最新的AI大模型能力。站长网2023-08-22 12:01:060001王慧文再融16亿!大模型创业百天成独角兽,腾讯押注,快手创始人入股
美团老王再创业的第4个月,投资估值光速跻身独角兽。量子位最新获悉,美团联合创始人王慧文的AI创业公司光年之外,已在近期完成了新一轮2.3亿美元(折合人民币16.3亿)融资,投前估值10亿美元,进场百天,晋升独角兽。光年之外的本轮融资,据称由源码资本领投,押注8000万美元,此外腾讯、五源资本和快手创始人宿华均参与其中。站长网2023-06-05 21:29:360000小红书新号单条点赞收藏破千,涨粉过百,分享我的一些经验浅谈
前几天,在我们的知乎群聊到了小红书这块,发现做自媒体的今年基本上很多人都同步做了小红书,从大家的分享下了解,目前小红书仍还处于有一定的流量红利,相对而言平台上的内容质量和用户质量也都比较高。实际上,这块我在去年就有过想法想去尝试,因为朋友圈有很多做小红书引流这块的基本上都拿到了结果,同时,也有很多人开启了专门针对小红书引流这块的培训,用户需求量还挺高,很多人都对这块有需求。站长网2023-05-11 11:36:320002马斯克:特斯拉目标年产200万辆Cybercab无人驾驶出租车
特斯拉今日发布了2024年第三季度的财报,数据显示该季度营收达到251.8亿美元,净利润为25.05亿美元,同比增长8%。在随后的财报电话会议上,特斯拉首席执行官马斯克透露了公司的未来计划,包括在2025年上半年交付更多经济型汽车,并预计明年的销售增长率将在20%到30%之间。0000小红书内测群聊AI对话功能 群内成员可与AI角色对话互动
近日,小红书推出了一项新的功能——群聊AI对话。这项功能允许用户在群聊中引入不同的AI角色,并与这些角色进行对话互动。用户只需将AI角色添加到群聊中,然后通过@AI角色的方式与其进行对话。根据所选择的角色不同,用户收到的回复话术也会有所不同。据了解,这项功能目前还处于内测阶段,并没有全面上线。只有部分用户能够参与内测,并且被选中的用户是随机的。这意味着并非所有用户都能够立即体验到这项新功能。站长网2023-10-19 14:59:270001