Sora生成火爆短片被指后期特效人工参与 不能保证视频一致性
划重点:
- Sora 火爆短片《气球人》揭秘:视频并非完全由 AI 生成,需要人类后期实现大量视觉效果。
- 视频一致性问题:Sora 不能保证不同镜头之间的主体一致性,需要详细描述角色形象来解决。
- 视频后期处理:Sora 生成的视频素材需要人类进行后期裁切、调速、去除不符合设定的元素等处理。
Sora 火爆短片《气球人》的背后,最新揭秘引发了争议。原来,这部视频并非完全由人工智能(AI)生成,其中有大量视觉效果需要人类后期实现。这一揭秘引起了网友的不满,认为 OpenAI 在宣传中误导了大众。事实上,OpenAI 曾介绍过《气球人》是由艺术家团队创作的,但并未详细说明视频是如何制作而成的。
据艺术家团队 Shy Kids 的揭秘,视频一致性是一个问题。Sora 并没有提供工具来实现不同镜头之间的主体一致性,即使提示词相同,两次运行结果也会有所不同。为了解决这个问题,团队详细描述了主角形象,比如服装和气球的类型。然而,在 Sora 生成的视频素材中仍然存在一些问题,比如气球的颜色与设定不符。此外,Sora 对摄影术语的理解有限,需要人类在后期处理中进行调整。
视频后期处理也是一个关键环节。Sora 不能保证视频的一致性,而且喜欢给气球加上不必要的元素,如人脸和绳子。此外,Sora 在时间控制方面也存在问题,需要人类进行裁切和调速等处理。最终,Shy Kids 团队只有约300份 Sora 生成的视频素材被用于影片中。
对于 Sora 的表现,Shy Kids 团队表示满意。他们认为,对于专业的电影团队来说,Sora 还有进步空间,但对于大部分人而言,Sora 已经足够惊艳。一些网友认同这一观点,认为 Sora 是现有工作流的有益补充,并希望 Adobe 等公司将其集成到软件中。
然而,一些网友对此表示不满,认为 Sora 背后有大量人类工作,而 AI 的存在却掩盖了他们的努力和价值。他们对 OpenAI 的营销方式感到厌倦。
微软宣布为Windows10用户提供付费安全更新计划,支持延长至2028年
站长之家(ChinaZ.com)12月6日消息:微软在最新声明中宣布,将为继续使用Windows10的个人用户提供付费的扩展安全更新(ESU)计划,以延长操作系统的支持周期。当前,Windows10的支持终止日期为2025年10月14日,而微软此举被认为是对广泛使用的Windows10用户的一项惊喜服务。站长网2023-12-06 09:51:410000好莱坞机构与 AI 公司合作,保护名人形象权
划重点:⭐好莱坞机构与AI科技公司Veritone合作,建立数字化名人形象库。⭐CAAvault允许存储和许可名人的声音和形象,以促进商业合作。⭐合作旨在保护名人利益,防止AI滥用名人形象和声音。站长网2024-05-22 20:33:080000腾讯NOW直播今日停止运营并下架
腾讯NOW直播将于今日11时正式停止运营并下架,为其历史画上句号。所有用户需要在2023年12月27日11时00分之前保存好个人所需资料,因为此后将无法再使用NOW直播的产品服务。对于用户账户内的余额,腾讯提供了两种处理方案:资产迁移和退款。用户可以选择将未消耗完的资产迁移到虎牙直播,或者申请退款。这两种方案的截止时间均为2024年2月2日00时00分。站长网2023-12-27 08:21:350000H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型
声明:本文来自于微信公众号新智元(ID:AI_era),作者:桃子润,授权站长之家转载发布。【新智元导读】H100让模型推理性能最高跃升8倍!英伟达最新开源软件TensorRT-LLM,将彻底改变LLM推理现状。「GPU贫民」即将告别困境!刚刚,英伟达发布了一款开源软件TensorRT-LLM,能够加速H100上大型语言模型的推理。那么,具体能提升多少倍?站长网2023-09-11 09:13:300002中国研究人员提出DualToken-ViT:CNN和视觉Transformer的融合,提高图像处理效率和准确性
要点:1、DualToken-ViT将卷积和自注意力联合使用,分别提取局部和全局信息,再将两者输出融合形成有效的注意力结构。2、使用位置感知全局令牌提升全局信息质量,令牌中还包含图像位置信息,有利于视觉任务。3、在相同FLOPs下,DualToken-ViT在图像分类、目标检测和语义分割任务上表现最好。站长网2023-10-02 16:16:030001