揭秘快手可灵背后的「关键7人」
国内风头最盛的AI视频团队是哪家?
毫无疑问,快手可灵。
发布一个月,体验用户超30万,生成700 万条短视频,开放网页Web端。哪怕这样,可灵还是一号难求,想上手体验的急得嗷嗷的。
而比可灵本身更神秘、更令人好奇的,是缔造出这款中国版Sora的背后团队。
量子位全网搜索,根据公开资料,发现了可灵团队来自清华、中科大、港科大、浙大、港中文、上海交大、南京大学等的“关键七人”。
整合梳理后,与可灵团队强相关的关键七人阵容大体如下:
盖坤(于越):快手高级副总裁、快手主站业务和社区科学负责人;清华博士,第一批“阿里星”。
张迪:快手副总裁、快手大模型团队负责人。
万鹏飞:快手视觉生成与互动中心负责人;中国科学技术大学和香港科技大学校友。
王鑫涛:快手视觉生成与互动中心高级研究员,领导视觉内容生成,特别是视频生成方面的工作;浙江大学和香港中文大学MMLab校友,师从汤晓鸥。
Xin Tao:快手科技视觉生成组(又名可灵团队)高级研究员和技术负责人;上海交大和香港中文大学校友,师从贾佳亚。
Haotian Yang:快手可灵团队成员;南京大学校友。
Yuan Gao:快手可灵团队成员。
若有知情小伙伴愿意提供更多信息,帮助量子位进行更正或补充,请随时在后台与我们联系。
快手可灵背后的ta们
盖坤(于越)
盖坤,博士毕业于清华大学,研究方向是识别与智能系统。
现任快手高级副总裁、快手科技经营管理委员会成员、商业生态委员会成员,担任主站线业务负责人并兼任社区科学线业务负责人。
2011年,盖坤以第一批“阿里星”的身份,加入阿里工作,花名靖世。
阿里星是阿里一直“暗藏”的顶尖校招技术人才项目,坊间传闻,每年能最终拿下阿里星Offer的不过寥寥数人(约占当年校招总数<0.3%)。
以及在外界的八卦中,最吸引人的还是“阿里星年薪上不封顶”这一条。
盖坤主要是在阿里妈妈做广告算法,负责竞争展示广告技术,以及其他跟AI相关的部分。
进入阿里工作后,盖坤提出了分片线性模型MLR,极大地提高了CTR预估的准确性,被外界称为“算法天才”。
2016年,他搭建出深度兴趣网络,以此对广告点击率进行预测。
2017年,他又和团队推出能预测用户点击偏好的新模型“深层用户网络兴趣分布”,更精准地为用户推荐商品。
离职前,盖坤的最后title为阿里妈妈精准展示广告技术总监,职级P10。
2020年,盖坤悄然跳槽,加入快手。
他以“于越”这个花名亮相,担任高级副总裁,同时也是快手科技经营管理委员会和商业生态委员会的成员。
去年1月旬,快手发布原CTO陈定佳离职的公告,接任者为盖坤和另一高级副总于冰,分别承担此前CTO的相关管理职责,向CEO程一笑负责。
此后,盖坤一并担任主站线业务负责人并兼任社区科学线业务负责人。
今年WAIC上,可灵大模型的新版本新功能,就是由盖坤出席发布。
张迪
张迪,现任快手技术副总裁、快手多媒体与大模型部负责人。
他作为快手多媒体与大模型部负责人的任命发生在去年初。
彼时,快手启动AI新战略,于是作为技术副总裁的张迪披挂上阵,担任大模型研发团队负责人,聚焦大模型、视觉生成模型和多模态模型等方向。
今年5月,张迪和盖坤等参与的《Parrot: Enhancing Multi-Turn Instruction Following for Large Language Models》入选顶会ACL2024。
万鹏飞
万鹏飞,本科毕业于中国科学技术大学EEIS系,后拿下香港科技大学博士。
其专注的技术方向包括图像/视频/3D AIGC、XR与数字人、Mobile/Efficient AI等。
现为快手视觉生成与互动中心负责人,快手可灵视频生成模型负责人,向张迪汇报。
在担任现有职务前,他长期担任快手Y-tech AI技术中心负责人,牵头了快手数字人系列解决方案。
致力于通过计算机视觉、图形学、机器学习、人机交互等领域的交叉,为各业务线提供智能化的多模态内容创作和互动体验解决方案。
今年1月,他参与外界活动的title仍然是这个;但刚结束的WAIC上,他以可灵视频生成模型负责人身份亮相。
公开资料显示,在2020年加入快手前,万鹏飞曾任美图影像实验室MTlab负责人。
王鑫涛
王鑫涛,本科毕业于浙江大学,后在香港中文大学MMLab(多媒体实验室)攻读博士学位,师从汤晓鸥。
Google Scholar页面显示,王鑫涛的论文被引次数为14406。
2020年博士毕业后,王鑫涛的第一站来到了腾讯,做视觉生成(图像、视频、3D)相关的研究工作
具体来说,他分别在腾讯AI实验室和腾讯ARC实验室担任高级研究员。
5月,王鑫涛在知乎发布文章,表示自己“最近来到了快手”,目前是快手科技KwaiVGI的高级研究员,部门隶属于快手多模型与AIGC部门。
现在,王鑫涛负责领导视觉内容生成,特别是视频生成方面的工作。
Xin Tao
Xin Tao,毕业于上海交通大学,后来又在香港中文大学计算机科学与工程系拿下博士学位,是港中文终身教授、IEEE会士贾佳亚的学生。
现在是快手科技视觉生成组(即可灵团队)的高级研究员和技术负责人。
他的研究兴趣包括视觉修复和生成。
读博前,他先后在Adobe创意技术实验室、腾讯优图实验室当过研究实习生。
2018年博士毕业后,他正式加入腾讯优图实验室,任高级研究员。
2020年年底,Xin Tao加入快手,在视频处理和分析组、Y-tech混合现实团队都呆过一段时间,负责牵头实用视频编辑算法的研究和技术转让,以及用于直播的2D数字人综合系统。
加入可灵团队后,Xin Tao专注于高效视频生成和编辑系统的研究和部署。
Haotian Yang
Haotian Yang,快手可灵团队成员。
毕业于南京大学,曾在IEEE、AAAI等顶会上发布论文。
2023年前后,Haotian Yang加入快手。
One More Thing
眼尖的小伙伴们应该已经发现了,还有一位叫Yuan Gao的同学没有进行详细介绍。
真相只有一个:
除合著论文外,暂时未能收集到Yuan Gao同学的更多信息。
要不大家老说呢,技术人才们总是喜欢蛰伏水下,默默搞个大新闻……
就挺遗憾的!
希望了解相关情况的朋友们来后台留言,量子位会一直关注Yuan Gao和可灵团队的新动态新进展,及时与大家共享学习。
另外,梳理过程中挂一漏万,如果有其它可灵团队同学的信息,欢迎大家补充~
参考链接:
[1]https://arxiv.org/abs/2406.04277
[2]https://scholar.google.com.hk/citations?user=FQgZpQoAAAAJ&hl=en
[3]https://scholar.google.com/citations?user=PXO4ygEAAAAJ&hl=zh-CN
[4]https://www.xtao.website/
[5]https://scholar.google.com/citations?user=LH71RGkAAAAJ&hl=en
贾跃亭称All in了自己:FF获纳斯达克继续上市批准
法拉第未来(FF)的创始人兼首席产品及用户生态官贾跃亭近日宣布,该公司已正式获得纳斯达克的继续上市批准,预示着这家备受瞩目的电动汽车制造商在资本市场上的地位得以稳固。不过,这一成就并非轻易取得,FF需在接下来的时间里满足一系列条件,包括在2024年7月31日前提交定期财报,并在同年8月31日前达到最低出价要求。站长网2024-06-28 17:21:510000生死局后,在线教育公司的花式转型
猿辅导三个字再次隆重地出现在公众面前时,距离那段迷茫岁月已经过去了近两年。2023年5月30日下午,儿童节前夕,猿辅导在北京国贸召开了一场盛大的产品发布会。它面向全国中小学生,推出小猿学练机,主打学习、练习一体化,以练促学,售价3899元。这意味着猿辅导正式宣布进军智能硬件市场,迈出历史性的第一步。站长网2023-06-03 19:04:280000预测超长蛋白质这事,CPU赢了
AI模型的推理在CPU上完成加速和优化,竟然不输传统方案?至少在生命科学和医疗制药方向,已经透露出这种信号。例如在处理AlphaFold2这类大型模型这件事上,大众普遍的认知可能就是堆GPU来进行大规模计算。但其实从去年开始,CPU便开始苦练内功,使端到端的通量足足提升到了原来的23.11倍。而现如今,CPU让这个数值greatagain——再次提升3.02倍!站长网2023-07-02 18:04:300000TikTok宣布支持iOS设备的密钥登录
据macrumors消息,TikTok宣布将引入对苹果passkeys的支持,为这个热门的短视频平台的用户提供更简单、更安全的登录方式。苹果在iOS16的发布时将passkeys集成到iOS中,它们也在iPadOS16.1及更高版本和macOSVentura中可以使用。站长网2023-07-19 11:23:180000《黑神话:悟空》通过ESRB评级!Xbox版本要来了
快科技10月20日消息,近日,《黑神话:悟空》通过了ESRB(娱乐软件分级委员会)的评级的T”评级(青少年级别)。值得注意的是,页面上支持平台显示为WindowsPC,PlayStation5,Xbox平台,这也意味着该游戏将在不久后登陆Xbox平台。而ESRB对《黑神话:悟空》的描述为:这是一款动作角色扮演游戏,玩家扮演天命人,执行寻找六根遗物的使命。站长网2024-10-20 14:05:370000