北大团队发起复现Sora计划“Open Sora” AnimateDiff大神响应
要点:
1. 北大团队联合兔展发起了复现Sora的计划,框架已搭建,袁粒和田永鸿领衔。
2. Open Sora计划采用三部分组成的框架,包括Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
3. 计划已经完成了初步功能的实现,团队在集结开源社区力量,希望尽可能完成复现。
北大团队联合兔展启动了复现Sora的计划,该项目名为Open Sora。这一举措的背后是资源有限的情况下,团队希望汇集开源社区的力量,以尽可能完成复现工作。
项目的核心团队由北大信息工程学院助理教授袁粒和北大计算机学院教授田永鸿等领导,共有13名成员。除了团队成员外,北大校友和AnimateDiff贡献者等也积极响应,并有人表示愿意提供高质量的数据集。
项目地址:https://top.aibase.com/tool/open-sora-plan
关于Sora的复现技术细节已经公布,项目框架包括三个主要部分:Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
为了解决Sora视频的可变长宽比问题,团队采用了上海AI Lab提出的FiT技术,实施了一种动态掩码策略。同时,团队还通过位置插值来处理可变分辨率,并使用Video VQ-VAE来支持可变时长的视频处理。团队已经初步实现了三个功能,并在项目主页上提供了两个demo,展示了10秒和18秒视频的重建效果。
尽管已经取得了一些进展,但团队面临着诸多挑战。目前的训练是在8个A100-80G上进行的,但仍然远远不够,而且需要更多的数据和GPU进行训练。团队已经完成了一些任务,包括采样脚本和在embeddings上添加类条件,但仍有一些待办事项需要完成。
项目的领衔者之一是袁粒,他是北大信息工程学院的助理教授,曾获得福布斯30岁以下亚洲杰出人物榜单的荣誉。另一位领衔者是田永鸿,他是北京大学博雅特聘教授,拥有丰富的科研经验和荣誉。
关于谁能率先发布中文版Sora的问题,目前仍然是一个未解之谜。在业内,有传言称字节可能会成为首个发布中文版Sora的公司。尽管有一些AI模型类似于Sora,比如最近出现的Boximator和Dreamina,但它们与Sora仍存在一定差距。然而,这个问题的答案还有待时间的揭晓。
腾讯牌面!周杰伦刘畊宏共同为《元梦之星》写歌
快科技1月12日消息,今天,腾讯旗下游戏《元梦之星》官方宣布,周杰伦、刘畊宏和罗文裕共同创作的游戏满月主题曲《星动力》正式上线。《星动力》这首歌曲,由刘畊宏演唱,周杰伦作曲,罗文裕/刘畊宏共同作词。据了解,2023年12月15日,腾讯首款正版合家欢派对游戏《元梦之星》正式开服,上线90分钟就冲上了AppStore免费榜第一,腾讯更是首期投入总计14亿元用于游戏生态的建设。站长网2024-01-13 10:13:500000Gartner:2023年全球AI芯片收入将达530亿美元 2027年达1194亿美元
本文概要:1:根据Gartner预测,2023年全球用于执行AI工作负载的半导体销售收入预计将同比增长20.9%,达到534亿美元。2:到2027年,AI芯片收入预计将比2023年的市场规模增长一倍以上,达到1194亿美元。3:许多行业和IT组织将部署包含AI芯片的系统,因为企业中AI工作负载的使用正在成熟。站长网2023-08-25 10:54:100000歌手也要失业了?suno v3 模型即将推出 人人皆可创作音乐
完蛋!歌手们的饭碗也要被AI砸了!SunoAI宣布,其最新的sunov3模型即将推出。从官方放出的音乐demo来看,V3模型的创作能力十分惊人。用户只需要简单的文字描述,就能创作出具备专业水准的音乐。官网地址:https://top.aibase.com/tool/suno-ai站长网2024-03-20 11:02:360000北京拟禁止直播平台销售保健品 不得以全网最低价误导消费者
近日,北京市市场监督管理局发布《北京市直播带货合规指引(征求意见稿)》,《指引》要求直播带货直播间运营者、直播带货人员和直播带货服务机构在直播中发布商业广告,应按规定严格审核把关。站长网2024-06-14 00:28:430000苹果,马斯克的新“仇人”?
OpenAI好像好久没有这么热闹了。12天的直播活动还在进行着,目前进度条刚一半,就已经抛出了不少重磅消息。Sora终于发布了,和苹果的合作也终于正式落地。当地时间12月12日,OpenAI宣布全面登陆苹果生态,可以运行苹果智能(AppleIntelligence)的设备现在可以无需注册一键呼出ChatGPT了。与此同时,OpenAI的外界压力愈发的大了。0000