字节跳动发布豆包视频生成模型 包括PixelDance、Seaweed两个版本
站长网2024-09-29 08:44:160阅
在2024年AI创新巡展上,火山引擎科技有限公司隆重推出了豆包·视频生成模型,标志着其大模型家族再添新成员。火山引擎总裁谭待在会上表示,豆包·视频生成模型具备多项创新性能,包括精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。
该模型能够理解和执行复杂的指令,实现多个主体间的交互,并能在视频主体的大动态和镜头间进行炫酷切换。此外,它还能够在多镜头切换中保持一致性,10秒内讲述一个完整的故事,并支持多种风格和比例,如黑白、3D动画、国画等。
豆包·视频生成模型包含两个版本:Doubao-视频生成PixelDance和Doubao-视频生成-Seaweed。
PixelDance V1.4是ByteDance Research团队开发的DiT结构的视频生成大模型,支持文生视频和图生视频,能够一次性生成长达10秒的精彩视频片段。它具备出色的语义理解能力,能快速生成优质的视频片段,适用于影视创作、广告传媒等多个场景。
Doubao-视频生成-Seaweed模型支持文生视频和图生视频两种生成方式,基于Transformer结构,利用时空压缩的潜空间进行训练,原生支持多分辨率生成,适配横屏、竖屏,并能够根据用户输入的高清图像分辨率进行适配和保真。默认输出为720p分辨率、24fps、时长5秒,并可动态延长至20-30秒。
豆包·视频生成模型预计将为电商营销、动画教育、城市文旅、微剧本(音乐MV、微电影、短剧等)等多个领域带来创新和效率提升。火山引擎表示,该模型的发布将全面加速AIGC应用创新。
0000
评论列表
共(0)条相关推荐
iQOO 11S发布:充电最快的骁龙8 Gen2旗舰 3799元起
快科技7月4日消息,iQOO11S正式发布。售价方面,iQOO11S12GB256GB售价3799元;16GB256GB售价4099元;15GB512GB售价4399元;16GB1TB售价4799元。对比iQOO11,iQOO11S升级为200W有线闪充,是迄今为止充电速度最快的骁龙8Gen2旗舰手机。站长网2023-07-05 09:17:200001京东许冉:将于7月13日发布京东大模型
凤凰网科技讯7月5日消息,京东集团CEO许冉表示,将于7月13日举行的京东全球科技探索者大会暨京东云峰会上发布京东大模型,推出新一代数字基础设施,致力于服务千行百业跨越产业新智能。站长网2023-07-06 05:18:280002微软技术主管表示英伟达人工智能芯片的供应正在改善
微软技术主管KevinScott周三表示,与几个月前相比,该公司现在更容易获得运行人工智能工作负载的英伟达芯片。Scott在加利福尼亚州DanaPoint的CodeConference上发言时说,英伟达GPU市场正在逐渐开放。自微软支持OpenAI去年底推出ChatGPT聊天机器人以来,这些GPU一直供不应求。站长网2023-09-28 14:25:450000百度推多模态模型UNIMO-G 支持还原图片ID
核心要点:百度提出了UNIMO-G统一图像生成框架,通过多模态条件扩散实现文本到图像生成,克服了文本描述简洁性对生成复杂细节图像的挑战。UNIMO-G包含多模态大语言模型(MLLM)和基于编码的多模态输入生成图像的条件去噪扩散网络两个核心组件,通过两阶段训练策略达到统一的图像生成能力。站长网2024-01-26 11:00:070000黄仁勋:下一波浪潮是物理AI 将进入全新机器人时代
站长之家(ChinaZ.com)6月5日消息:在最近的一次演讲中,英伟达公司的CEO黄仁勋描绘了一个引人注目的未来愿景——物理AI,这一新的技术浪潮正在悄然改变我们的世界。他提出,物理AI,或称为实体AI,是指那些能够模拟智能生物体在控制、形态、动作执行和感知能力上协同进化的实体系统。站长网2024-06-05 15:24:310000