北大团队发起复现Sora计划“Open Sora” AnimateDiff大神响应
要点:
1. 北大团队联合兔展发起了复现Sora的计划,框架已搭建,袁粒和田永鸿领衔。
2. Open Sora计划采用三部分组成的框架,包括Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
3. 计划已经完成了初步功能的实现,团队在集结开源社区力量,希望尽可能完成复现。
北大团队联合兔展启动了复现Sora的计划,该项目名为Open Sora。这一举措的背后是资源有限的情况下,团队希望汇集开源社区的力量,以尽可能完成复现工作。
项目的核心团队由北大信息工程学院助理教授袁粒和北大计算机学院教授田永鸿等领导,共有13名成员。除了团队成员外,北大校友和AnimateDiff贡献者等也积极响应,并有人表示愿意提供高质量的数据集。
项目地址:https://top.aibase.com/tool/open-sora-plan
关于Sora的复现技术细节已经公布,项目框架包括三个主要部分:Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
为了解决Sora视频的可变长宽比问题,团队采用了上海AI Lab提出的FiT技术,实施了一种动态掩码策略。同时,团队还通过位置插值来处理可变分辨率,并使用Video VQ-VAE来支持可变时长的视频处理。团队已经初步实现了三个功能,并在项目主页上提供了两个demo,展示了10秒和18秒视频的重建效果。
尽管已经取得了一些进展,但团队面临着诸多挑战。目前的训练是在8个A100-80G上进行的,但仍然远远不够,而且需要更多的数据和GPU进行训练。团队已经完成了一些任务,包括采样脚本和在embeddings上添加类条件,但仍有一些待办事项需要完成。
项目的领衔者之一是袁粒,他是北大信息工程学院的助理教授,曾获得福布斯30岁以下亚洲杰出人物榜单的荣誉。另一位领衔者是田永鸿,他是北京大学博雅特聘教授,拥有丰富的科研经验和荣誉。
关于谁能率先发布中文版Sora的问题,目前仍然是一个未解之谜。在业内,有传言称字节可能会成为首个发布中文版Sora的公司。尽管有一些AI模型类似于Sora,比如最近出现的Boximator和Dreamina,但它们与Sora仍存在一定差距。然而,这个问题的答案还有待时间的揭晓。
暂停元宇宙、进军AI、复刻推特,Meta亏损两年终盈利
近日,互联网与社交媒体巨头Meta发布了2023年Q2季度财报。在连续两年的亏损后,Meta终于交出了一份不错的成绩单。站长网2023-08-04 11:11:270000OpenAI CEO:初创公司完全远程工作是“科技行业最严重的错误之一”
OpenAI首席执行官山姆·阿尔特曼(SamAltman)表示,初创公司需要面对面的工作才能有效。他表示,远程工作是科技行业最大的错误之一,实验已经结束。许多公司CEO首席执行官一直要求远程员工在办公室花费更多时间其中包括迪士尼的BobIger、星巴克的HowardSchultz和新闻集团的RobertThomson。在大流行期间,许多办公室工作人员变得更喜欢远程工作。站长网2023-05-08 09:52:1400002023,大厂“瘦”在哪了?
站在2023年的尾巴上,回望这一年,我们发现很多互联网大厂“瘦”了。字节跳动将Pico团队大幅裁撤,关停、出售部分游戏项目;腾讯精简XR业务线,变更硬件发展路径;美团放弃自营打车,全面转向聚合模式;小红书关闭自营电商平台小绿洲,京东关闭印尼和泰国站点……「定焦」统计了头部大厂在2023年的“瘦身”动作,请看下表:0000李彦宏:百度很快会推出文心大模型3.5版本
在今日的2023中关村论坛上,百度CEO李彦宏表示,百度很快会正式推出文心大模型的3.5版本。在李彦宏的发言中,他强调了大模型对人工智能和整个世界的巨大影响。他表示,由于大算力和大数据的出现,智能系统的涌现已经成为现实。以前的人工智能需要我们教机器学习某种特定技能,如果我们没有教过,AI就不会掌握。但是大模型的出现改变了这一情况,AI可以学会以前从未接触过的技能。站长网2023-05-26 11:20:430003苹果首款头显登陆中国!Vision Pro国行版来了:售价超2万
快科技6月6日消息,分析师郭明錤在社交平台上表示,苹果供应链将从6月中旬开始向美国以外的市场运送VisionPro,7月份在全球上市开卖。郭明錤透露,VisionPro将在中国、日本、新加坡、英国、法国、德国等国家销售,其中国行版已经获得入网许可。按照美版3499美元(约合人民币2.5万元)的价格来看,VisionPro国行版价格也会超过2万元。站长网2024-06-06 14:11:040000