字节跳动发布豆包视频生成模型 包括PixelDance、Seaweed两个版本
站长网2024-09-29 08:44:160阅
在2024年AI创新巡展上,火山引擎科技有限公司隆重推出了豆包·视频生成模型,标志着其大模型家族再添新成员。火山引擎总裁谭待在会上表示,豆包·视频生成模型具备多项创新性能,包括精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。
该模型能够理解和执行复杂的指令,实现多个主体间的交互,并能在视频主体的大动态和镜头间进行炫酷切换。此外,它还能够在多镜头切换中保持一致性,10秒内讲述一个完整的故事,并支持多种风格和比例,如黑白、3D动画、国画等。
豆包·视频生成模型包含两个版本:Doubao-视频生成PixelDance和Doubao-视频生成-Seaweed。
PixelDance V1.4是ByteDance Research团队开发的DiT结构的视频生成大模型,支持文生视频和图生视频,能够一次性生成长达10秒的精彩视频片段。它具备出色的语义理解能力,能快速生成优质的视频片段,适用于影视创作、广告传媒等多个场景。
Doubao-视频生成-Seaweed模型支持文生视频和图生视频两种生成方式,基于Transformer结构,利用时空压缩的潜空间进行训练,原生支持多分辨率生成,适配横屏、竖屏,并能够根据用户输入的高清图像分辨率进行适配和保真。默认输出为720p分辨率、24fps、时长5秒,并可动态延长至20-30秒。
豆包·视频生成模型预计将为电商营销、动画教育、城市文旅、微剧本(音乐MV、微电影、短剧等)等多个领域带来创新和效率提升。火山引擎表示,该模型的发布将全面加速AIGC应用创新。
0000
评论列表
共(0)条相关推荐
AI芯片需求激增,美光科技首次在六个季度内实现收入增长
**划重点:**1.💹美光科技首次在六个季度内实现收入增长,部分原因是人工智能芯片需求激增。2.🧠公司新推出的HBM3E内存芯片模块备受投资者青睐,预计在2024财年将为公司带来数亿美元的收入。3.💻美光看好人工智能在个人电脑和移动设备中的应用,计划增加在2024财年的资本支出,以满足新内存模块的生产需求。0000网上的流量卡和营业厅一样吗?有什么区别呢?
现在不管是在线下营业厅还是在线上,都是可以办理电话卡的,那么,这两种渠道办理的电话卡有什么不同呢?都有什么优缺点呢,接下来我们一块来看一下吧。电话卡线上线下办理有什么区别?这几点了解一下:一、资费不同:线下营业厅的是标准资费,比如要办理100G左右的流量套餐需要月租189元,甚至200元以上,而线上办理的套餐都在优惠套餐,100G的流量只需要29-39呢;站长网2023-05-23 20:42:420000谷歌给员工“断网” 2000多人一下回到远古时代
凤凰网科技讯北京时间7月19日消息,谷歌公司将在周三启动一项新的试点计划,部分员工只能使用没有接入互联网的台式机。谷歌称,这么做是为了降低网络攻击风险。谷歌最初选择了2500多名员工参加这一计划,但是在收到反馈意见后,谷歌修改了试点计划,允许员工退出,并向志愿者开放这一计划。谷歌将在选定的台式机上禁用互联网,员工只能使用公司内部网络工具以及Gmail、谷歌云端硬盘等谷歌旗下网站。站长网2023-07-19 11:23:170000Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元
划重点:-💰以1171万美元的成本运行LIama2,引发热议-💻Groq的芯片性能高,但成本也随之增加-🔍分析师对Groq成本和效益进行评估,与英伟达GPU进行对比站长网2024-02-21 14:56:080000Stable Diffusion团队放大招!新绘画模型直出AI海报,实现像素级图像生成
开源AI绘画扛把子,StableDiffusion背后公司StabilityAI再放大招!全新开源模型DeepFloydIF,一下获星2千并登上GitHub热门榜。DeepFloydIF不光图像质量是照片级的,还解决了文生图的两大难题:准确绘制文字。(霓虹灯招牌上写着xxx)以及准确理解空间关系。(一只猫照镜子看见狮子的倒影)站长网2023-05-12 20:38:250000