谷歌 Gemini 1.5 Pro 称 OpenAI Sora 生成的视频是假的
划重点:
- 💻 谷歌 Gemini1.5Pro 对 OpenAI 的 Sora 生成的视频提出质疑,称其是假的,并指出重大不一致之处。
- 🤖 谷歌的新技术 Gemini1.5Pro 对日本雪街樱花场景进行解析,指出其中的疑点,对视频的真实性产生怀疑。
- 🌸 OpenAI 的 Sora 是一款新型文本转视频工具,能够创作长达60秒的视频,展现高度详细的场景、复杂的摄像动作和多个角色的生动情感。
谷歌的 Gemini1.5Pro 对 OpenAI 的 Sora 生成的视频提出了质疑,称其为伪造,并指出其中存在重大不一致之处。最近,两家科技巨头谷歌和 OpenAI 分别推出了他们的最新进展 ——Gemini1.5Pro 和 Sora。OpenAI 的 Sora 发布的战略时间引发了人们对是否有意转移注意力,避开了谷歌 Gemini1.5的猜测。
作为回击,谷歌在 X 发布了一份详细分析,对 Sora 创建的视频进行了批判。Gemini1.5Pro 分析了一个场景,展示了日本一条铺满樱花的雪街。该分析指出了几处不一致之处,对视频的真实性产生了怀疑。
根据 Gemini1.5Pro 的观察,大雪纷飞和盛开的樱花并存的场景让人感到疑惑,因为樱花通常在春季盛开,不会受到雪的影响。进一步的审查显示,视频中的雪花呈现出一种统一且不自然的模式,与现实生活中的不规则情况不符。此外,尽管下着大雪,视频中的角色却没有穿冬季服装。
Gemini1.5Pro 在分析结束时表示:“总体而言,视频在视觉上吸引人,但其中的不一致之处表明这并非真实场景。”
Sora 是 OpenAI 全新的超酷文本转视频工具,可以创建长达60秒的视频,展现高度详细的场景、复杂的摄像动作和多个角色的生动情感。许多人也将这视为视频生成领域的一个 ChatGPT 时刻。
谷歌的 Gemini1.5Pro 具有惊人的1M 标记上下文窗口,不仅超过了 GPT-4Turbo 的128K,还超过了 Anthropic Claude2.1的200K,它可以一次处理大量信息,包括1小时的视频、11小时的音频以及拥有超过3万行代码或超过70万字的代码库。
过于低效?5成以上开发者觉得开会是在浪费时间
【编者按】多年来,科技界的从业者普遍对会议感到厌倦,调查显示32%的人认为会议没必要。Shopify取消了所有三人以上的会议,节省了322,000个员工工时。会议浪费时间、糟糕的会议造成负面影响,但会议对协作、决策和知识分享有价值。优化会议策略包括精选参与者、明确议程、控制会议时间,使用合适的工具替代部分会议,可以提高工作效率。站长网2023-07-18 12:30:500001借势大模型,科大讯飞走出低谷了吗?
AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。全面Allin大模型的一年,科大讯飞交出了首份成绩单,2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司股东的净利润为6.57亿元,同比增长17.12%。站长网2024-04-24 18:09:580000京东宣布:春晚30亿红包人人有份!
快科技1月30日消息,京东已成为2024年总台春晚独家互动合作平台。京东今天发消息称,除夕看春晚,下载并打开京东APP,1亿份实物好礼一分钱带回家,更有30亿红包人人有份!此外,京东还准备了超多超多、多到购物车装不下的实物好礼,到底都有啥?明天就将陆续揭开面纱!站长网2024-01-30 16:54:130000正交微调解锁文本创建逼真图像新能力 实现对生成图像的精确控制
划重点:-研究人员引入正交微调(OFT)方法,极大地增强了对基于文本的图像生成模型的控制能力。-OFT使用正交变换方法,保持神经元之间的关系结构,确保模型的语义生成能力得到保留。-OFT方法在生成质量和效率方面表现出色,具有广泛的实际应用和影响。站长网2024-01-26 10:30:120000视频转视频框架AnyV2V 可修改源视频主题、风格等
近期,一项名为AnyV2V的全新视频转视频框架引起了广泛关注。这一框架的独特之处在于,它不仅支持对源视频进行深度修改,还能加入附加的控制元素,如文本提示、主题或风格,以生成一个既与原视频相符,又与所提供的控制内容相匹配的新视频。论文地址:https://arxiv.org/html/2403.14468v1#S6站长网2024-03-23 05:18:220000