深入实用环节,AI如何让剧本“活起来”?|对话猫眼神笔马良项目技术负责人张蒙
影视行业拥抱AI的速度超出我们的想象。AI编剧、AI构图、AI分镜、AI选角、虚拟拍摄、AI辅助制片管理……各种各样的AI产品正在渗入影视产业的各个环节。
9月27日,猫眼娱乐发布了首个面向长剧本解析的动态故事板AI生成工具——神笔马良,该产品可根据用户上传的剧本,进行一键智能分析、智能角色创作、智能分镜创作、智能台词朗读,实现剧本内容的视听化呈现。
“我们发现虽然目前AIGC技术对于直接生成影视片段还有较大差距,但是对于创作过程中的某些阶段是可以有辅助和加速的可能的,比如角色场景概念图,项目书,故事板分镜图,这些垂类场景就是AI应用产品的空间。”神笔马良项目技术负责人张蒙告诉「深响」。
不同于能在视频成果中“一目了然”的AI产品,神笔马良的定位暂时没有面向最终影视视频的生成,而是面向影视创作的中间过程,生成和传递关键信息,辅助后续创作。这或许是影视行业拥抱AI的必经之路——让AI不再只是噱头,能为行业提效带来实际可应用的价值,这也同样是AI产品商业化的可能性所在。
为何要做一个AI分镜工具?
在影视生产流程中,分镜起着“承上启下”的作用:当剧本完成后,在开始拍摄之前,一个必备的环节便是把故事情节内容以镜头为基本单位,划分出不同的景别、角度、声画形式、镜头关系,这相当于将文字剧本转化为视觉台本,后期的拍摄和制作,导演都要以此为依据。
在好莱坞,几乎每部电影都有专门的分镜制作团队。在国内,据张蒙介绍,谁来做分镜、分镜产出的质量及时间成本,并不统一。“导演会画就导演画,或者摄影画,也有干脆不画的,还有就是请专业的剧本分镜师来做,这样成本便被拉高。”
剧本转分镜领域的痛点显而易见——不画分镜,可能影响着后续的成片,到时候再修改牵一发而动全身;邀请专业的人工来画,时间、人力、金钱成本又被放大。
张蒙告诉「深响」,我们选择剧本转分镜这样一个整体看起来比较垂直,实际对于行业有用的场景来切入,希望能够较好的解决行业痛点,提升行业的生产效率。
项目落地前,他试用了市面上已有的AI分镜工具,发现痛点并没有得到根本解决,“有的是针对生图功能做设计,需要用户逐张输入每个镜头画面的描述,程序复杂;还有的可以接受输入的文本很短,并不适用于影视行业的应用场景。”
这样的背景下,神笔马良的切入方向逐渐清晰——聚焦长文本剧本和故事的理解,帮助创作者把写好的故事方便快捷的以图像视频等可视化的方式准确的表达,成为行业创作者的帮手。
今年2月底,神笔马良进入筹备研发阶段,经过半年多的打磨、优化,9月底内测上线。内测阶段,神笔马良小范围地邀请了行业从业者试用,得到的反馈多是“有用有效、降低成本”。
创作者在上传完剧本故事后,选择想要的风格,就会得到角色小传、智能配音、动态视频,在生成过程中也能随时根据自己的要求上手修改,从文字剧本到动态故事板,整个过程只需几十分钟,节省了人力与时间。
另外,为了真正满足创作者的实际应用需求,张蒙团队在设计时也加入了不少产品巧思。
比如流畅输入长文本。张蒙介绍,神笔马良对接了多家大模型接口以及开源自建的模型,根据实际情况应用,输出40集的剧本没问题。
还比如一键智能帮写。由于生成式系统给出的结果有不确定性,有的时候需要反复尝试调整提示词,而用户完整修改提示词是一个比较麻烦的事情,所以产品设计上增加了一个AI帮写的功能,只要像对话一样给AI提出需求,它就能帮用户完整改写提示词。
神笔马良AI帮写
目前,神笔马良是一个初期的1.0版本。张蒙也坦言,1.0版本在内部沟通应用没问题,比如剧本围读环节AI分镜可以给到很多的参考,但要是导演直接在片场拿去做拍摄指导还需要再优化调整。
「深响」试用发现,神笔马良在解析文本、提炼剧情方面整体较为准确,而在深刻理解角色身份方面上还有提升的空间。比如让神笔马良解析《甄嬛传》第一集的剧本,它可以抓住故事的主要脉络,对于复杂的人物关系和场景的匹配仍然需要人工干预。
接下来,神笔马良也会结合着从业者反馈,做下一步的迭代升级。
“对于B端创作者,会优化体验,细化颗粒度,降低用户使用过程中的调试次数,结果输出上,后续我们也会增加角色场景概念图、项目书的生成和导出。同时我们也想横向拓展C端的应用场景,例如短视频短剧制作领域,教育,广告等,探索更多的商业付费可能。”张蒙说道。
神笔马良解析分镜头
AI影视行至何处?
不只是神笔马良,过去这一年AI如同按下加速键。去年大家还是试水心态,今年各种各样的AI影视工具已经应用到项目生产,市面上也产出了不少的“AI成品”。
新技术新工具如雨后春笋是好事,但在实际操作环节,这些AI工具如何帮助影视生产?AI影视发展到了哪一步?
众所周知,影视生产多链条且长周期,这中间有大量的人力重复工作,也时刻需要创作者脑洞大开、产出创意,无论哪一种,对AI的辅助功能都是刚需。按照生产环节拆分,AI确实深入到生产、管理的各个流程,只不过进度不一。
创作环节,剧本是故事的源头,也是人的主观情感作用最大的一环,需要AI辅助来提供点子和参考。2021年,海马轻帆就上线了类似“AI编剧”的应用工具,如今像影视公司华策、视频平台爱奇艺、VaaS平台供应商一览科技都推出了剧本智能创作系统。
目前市场上AI编剧的主要应用在两个方面,一是创意生产,在早期创意阶段,AI提供方向,帮助编剧筛选有潜力、有价值的故事线;二是对剧本进行商业化评估,比如人设是否足够有吸引力、剧情节奏是否吸引人、商业空间多大,一一给出分析,更像是好莱坞常见的“剧本医生”。
据观察,让AI编剧无到有进行剧本生产还有一定距离,但的确带来了创作效率的提升。一览科技创始人、CEO罗江春曾表示,原来编剧可能绞尽脑汁一天能写3至5个情节,有了AI的辅助可能一天能写的情节可以得到倍数级增长。
在制作环节,采用大数据、AI进行影视综选角在当下也不是什么新鲜事。
过去按照传统影视流程选角,通常是先发布招募需求,进行线下邀约、面试,初步筛选,这种选角模式时间周期长,工作量大,且效率低下。要么就是“熟人关系”式选角,影响最终呈现效果。
2018年,大IP、大流量失效,影视行业泡沫出清,这也倒催着市场诞生了不少专业的AI选角工具:通过数据评估工作,建立不同类型演员的资料库和价值评估档案,让选角专业化、系统化。比如爱奇艺《中国新说唱》潘玮柏、邓紫棋,《这就是街舞》第一季队长易烊千玺、《长安十二时辰》中雷佳音的选角,就分别出自爱奇艺、优酷推出的AI选角系统。
在宣发环节,AI应用也变得更系统、更智能。
过去,AI在宣发环节最常见的是产出海报、产出剧照,今年我们发现“AI角色”的应用给影视宣发带来了新的空间。
为了能延长用户的追剧情感、增加剧粉的粘性,爱奇艺、腾讯视频推出了影视剧定制角色AI玩法,在爱奇艺《唐朝诡事录之西行》播出时,用户能和角色AI对话,加入主角团群聊;《长相思2》热播期间,与角色对话、还原经典剧情桥段的截图在社交平台迅速出圈,并给剧集实现了一波引流。
在管理层面,AI也被引入制片管理系统。在筹备期、拍摄期、后期阶段,腾讯视频就深度应用AI,提升影视工业各环节的工作效率和管理精确度。比如在剧本拆解环节,AI可以快速分析出剧中角色、场景、道具、服装、造型、场次等信息,那制片团队便能根据这些信息制定资源配置规划和拍摄计划,避免资源浪费。还有在预算及财务管理方面,AI技术可以提前对预算支出做异常检测,给制片人提供风险预警。
从以上生产环节中不难看出,AI在影视行业的作用有两类:
一种是“做减法”,对于大量繁琐的数据梳理、信息管理等工作,进行智能化管理,比如针对用户观影数据进行选角,在制片管理中对场务、拍摄计划同步,让流程化繁为简,帮助节省人力物力。
另一种是“做加法”,对生产环节的创意工作“锦上添花”,比如剧本创作时提供创意点子,生成角色AI和观众趣味互动,辅助生产、创新玩法。
按照AI工具诞生的时间线来看,随着AIGC技术探索的深入,往垂类场景发力、注重实用性是一大明显趋势。今年5月,阿里大文娱首个妆造大模型神力霓裳诞生,瞄准的便是古装剧的妆造创意设计这一应用场景,同样,9月27日猫眼娱乐的神笔马良,选中剧本转分镜为切入点也是一样的思路。
“文生文、文生图等大模型为了广泛的实用性,只为完成基础的功能,而各个应用领域的直接需求与基础模型功能之间的距离,就是应用级产品的空间,在这一层面会诞生不少的垂类产品。”张蒙说道。
虽说AI已经深入到了影视创作环节,但就目前来看,从应用到实际成片、能直接让观众感知到结果,还有一定距离。而且很多AI工具,目前还需要人力上手多次调教才能产出满意的作品。
在张蒙看来,现在AI应用对于影视创作的影响,还都是在加速影视传统流程的某些节点,而没有到改变流程的地步。不过可以明确看到的是,越来越多的AI新工具诞生,正在为影视行业提效打开更大的空间。道路虽远,行则将至。
以下是「深响」和猫眼娱乐神笔马良项目技术负责人张蒙的部分对话实录:
【关于神笔马良】
深响:剧本转分镜感觉在整个影视链条里比较垂直细分,咱们为什么选择这个场景作为切入点?
张蒙:影视行业的创作周期是比较长的,成本投入比较大,真人电影是如此,而动画电影的情况更甚,这些因素都制约着行业的发展。同时,近两年生成式AI技术爆发,猫眼也在一直持续的关注,寻找可以和影视行业业务相关联的应用点。我们发现虽然目前AIGC的技术对于直接生成影视片段还有较大差距,但是对于创作过程中的某些阶段是可以有辅助和加速的可能的,比如角色场景概念图,项目书,故事板分镜图等。所以我们选择了这么一个虽然整体看比较垂直,但是对于行业有切实有用的场景来切入,希望能够较好的解决行业痛点,提升行业的生产效率。在垂直专业领域站稳脚跟的同时向其他横向应用领域扩展。
深响:过去在这个场景下从业者有何痛点?AI如何可以辅助解决?
张蒙:剧本转分镜肯定是在各个影视拍摄过程中都有的,有一些导演他可能经验特别丰富,就直接在脑子里自己画完,然后再落到纸面上去产出。也有一些导演就习惯找人画。还有一些像我了解到的是找专门的机构/专业的分镜师去生成,这种形式的成本很高。
深响:能否详细解析一下神笔马良的工作原理?相比起市面上已有的AI分镜工具,神笔马良有哪些特点?
张蒙:这款产品的主要功能是针对较长的完整剧本或者故事文本进行剧情理解,生成角色小传以及形象图,进行场次,镜头的划分,生成故事板分镜图,角色配音等。整个流程包括多个任务,基于底层语言大模型和文生图大模型的能力拆分任务分别处理。包括角色提取,关系提取,人物小传以及形象生成,拆分剧情,划分场次和镜头,进而生成每个镜头的画面描述,生成镜头图片,根据人物的形象选择音色,台词和旁白配音等功能。
目前观察市面上的产品,一些主要是针对生图功能做设计,需要用户逐张输入每个镜头画面的描述。另一些可以接受输入的文本很短,有些是用户输入几句话系统帮忙扩写故事。这几种对于普通用户制作一些简单故事情节是可以的,但是并不适用于影视行业的应用场景,影视行业领域故事剧本的创作是非常专业且要求很高的。一方面AI的能力还达不到,另一方面,我们也是想以创作者为核心,系统只是提供辅助创作的工具,所以我们并没有增加AI写作的部分,而是把精力集中在对与长文本剧本和故事的理解上,帮助创作者把写好的故事怎样方便快捷的以图像视频等可视化的方式准确的表达出来,真正变成行业创作者的帮手。
深响:内测期有没有邀请从业者来试用?都收到了哪些反馈?
张蒙:上线之前小范围内邀请了一些行业人士来试用,这段时间也有用户持续注册、试用,我们现在收到的反馈就是说大家对于剧本快速生成故事板、拆分成分镜头的成品觉得还是挺有用的、也比较有效;也有一些反馈提到了角色小传的生成对项目创投、项目书制作提供了很大的便利。
当然也有一些改进意见,比如从专业的角度来讲,神笔马良是面向影视剧创作流程,从故事板应用场景来说问题不大,但对于导演直接拿来去片场做拍摄指导来说,颗粒度还不够细,后续我们也会围绕这方面做优化。其实开始我们也能够做得更细一些,为什么没做呢?我们担心产品做得稍微复杂一点,大家在初始入门的时候就会有一些使用门槛,会阻碍这个产品的推广。后续大家熟悉了这个流程,知道我们在做什么,那我们再沿着更专业的方向去发展一版产品。
之后的升级方向会有两种,一种就是刚刚说的面向B端专业创作者优化体验,另外一种就是增加图生视频功能,面向C端。
深响:神笔马良如何改变传统的工作流程?可否对比传统的步骤来谈,之前“人工”画分镜需要的时间成本是怎样的,应用神笔马良之后的效率能提升多少?除了剧本转分镜外,神笔马良的应用场景还有项目提报、创投路演、创意阐释,能否介绍下咱们在这些场景里怎么发挥作用?
张蒙:传统创作流程中,通常要经过创意,剧本大纲,剧本的文本创作阶段,然后通过剧本或者大纲来创作故事板,通过剧本来创作分镜图。每张故事板或分镜图需要“人工”来画的话,可能需要几周时间。但是通过系统可能几十分钟就可以完成了。除了故事板分镜图之外,我们后续的规划中也会将角色库中的信息提供导出,生成人物和场景的概念图,人物角色的小传介绍等,结合基本的剧情故事板自动生成项目书,这对于项目提报等流程都是比较有用的。
【关于AI在影视行业的应用】
深响:我们之前也跟一些影视从业者聊了聊,大家反馈AI确实越来越多应用了尤其是美术组,但细聊下来似乎大家对概设图更为看重,您如何理解神笔马良能解决的需求场景?
张蒙:我觉得目前大家对于概念图更看重,主要是因为目前生成内容的质量所限,对于概念图的生成已经可以胜任,但是对于最终呈现的视频生成还有不小的差距。画面的质量虽然已经很高,但是特别细节部分的可控性达不到要求,为了制作流程做示意可以,离普通观众接触到的最终呈现的要求还有差距。因此神笔马良的定位暂时没有面向最终影视视频的生成,而是面向故事板分镜图是在影视创作过程的中间结果,主要作用是生成和传递关键信息,辅助后续的创作过程,所以我们认为以目前的内容生成水平,在这种场景下是有应用空间和实际需求的。
深响:今年九月份,国产视频生成大模型各种消息不断,快手、阿里云、美图、火山引擎,包括猫眼娱乐都在上个月宣布了生成新的工具或者对已有的产品做升级。您怎么看这一轮大家的密集爆发?现在AI工具的入局者不少,长视频平台在做、专业的影视公司在做、还有很多的创业公司,您觉得未来这块会是怎样的一个格局?
张蒙:我观察到的目前的产品爆发大致分为两种,一种就是各大厂的基础大模型推出,例如快手、火山等的文生图、文生视频基础模型。在国内平台有大量视频数据,足够的算力资源投入,相似模型架构设计的情况下,国内的模型会逐步追赶并不落后于国外的产品。另一种是应用级的产品,因为从基础的文生图生视频,再到实际的各个应用领域,其实都有一定的工作要做,基础模型为了广泛的实用性,只为完成基础的功能,而各个应用领域的直接需求与基础模型功能之间的距离,就是应用级产品的空间,在这一层面可能会诞生不少的垂类产品,它们使用基础模型的能力,面向垂直领域的应用场景缩短用户的使用路径,提升用户的体验,满足实际应用需求。
深响:感觉像剧本那个制片、管理这种大的环节,其实都有对应的 AI 的产品了,神笔马良选中了剧本转分镜这样一个特别垂直的切入点,您觉得接下来想再入局,垂直细分是不是就是接下来影视AI的一个趋势了?
张蒙:我觉得其实也不一定只是影视剧行业了,未来确实是会不断有新的垂类产品产生。
大模型的能力不断提升,底层的基础模型需要是一个泛化性的、适用于各行各业的一个应用场景,所以就不会把某个行业的具体的某些业务逻辑包在这个场景,比如说现在这种对话式的,或者文生视频、文生图等大模型,都是单元性的基础功能做得很好,但是这个部分跟某些业务的具体应用场景中还是稍微有一点距离的,那这部分就是刚才提到的所谓垂直行业的产品空间,包括神笔马良也是一样的,进一步拉近大模型基础能力与实际业务之间的距离。
深响:其实观察国内市面上影视从业者对AI的应用,有两种走势:一种是短剧及动画,由AI全流程生产;一种是在长视频的某个环节具体应用(剧本、选角、宣发),我们理解后者更加类似SaaS的商业模式,从商业模式来看,您觉得未来会有哪些空间?
张蒙:影视创作,包括动画在内,整个生产过程是一个很多任务组合起来的复杂过程,每个任务节点所需要投入的资源和能力也都不完全相同。目前通过AI全流程生产的内容,其实也是有AI逐步完成中间的每个步骤之后串联起来。目前的AI应用对于影视创作的影响,还都是在加速传统流程的某些节点,而没有到改变流程的地步。所以无论是完成单个环节还是整个流程,没有太大的本质差别,就像某些影视公司可以独自完成全流程,某些影视公司专注于其中某些环节一样,都有一定的商业空间。
小米14/Pro外观公布:两款或均为直边直屏
小米将于10月26日正式发布小米14系列手机,其中包括小米14和小米14Pro两款机型。这次小米14Pro采用了标准版类似的直角边框设计,这是自从小米10开始推出Pro机型以来的首次。从图片来看,小米14Pro似乎还抛弃了曲面屏,中框部分并没有弧度。站长网2023-10-24 21:32:260000维基百科创始人公开表示对 ChatGPT 的可靠性表示担忧
划重点:-🚫维基百科创始人JimmyWales在WebSummit上表示,ChatGPT作为可靠的信息来源还有很长的路要走。他认为使用ChatGPT可能导致错误信息被纳入数字产品中。-🤝Wales指出,OpenAI与微软的合作将对谷歌构成问题。他认为这将是一场竞争战役,对于像开源和可靠信息等问题,他一直是互联网上有影响力的声音之一。站长网2023-11-15 19:32:550000解密Sora 13人团队:北大校友在内3名华人,应届博士带着21岁天才少年
【新智元导读】Sora团队,除了由伯克利应届生带队,有多名LeCun学生参与。其中还有包括北大校友在内的3位华人研究员,以及20岁就加入OpenAI的天才工程师。OpenAI用Sora震惊了世界。到底是什么样的天才团队,能开发出这样的旷世大作?结果一看OpenAI的作者团队只有13个人,应届博士带队,00后参与,团队包括3名华人,有一名北大校友。TimBrooks站长网2024-02-19 15:03:150000近半年看到的最创新的虚拟社交App,没有之一
除了人物位移、Avatar系统、基于距离的语音互动这些虚拟社交产品的基础配置,ParaSpace的神奇之处在于允许用户“一键克隆自己附近用户的Avatar”,一个申请、一个同意,用户便可以立即免费获得对方的全部装扮。帮助用户创建第二身份的App不在少数、克隆用户现实形象的App也有存在,但像ParaSpace直接让用户成为想成为的任何人的产品确实并不多。站长网2023-10-10 09:08:53000130天涨粉775W,但@k总 “带不动货”
“家人们又破记录了,28万人卖一单啦,加油!”热闹的抖音直播间里,说出这句话的@k总显得凄凉又好笑。事实上,这已经不是@k总第一次在直播间取得这样的“另类成绩”,在此之前其直播间“10万人卖8单”“30万人卖5单”的战绩广为流传,让不少吃瓜网友顺藤摸瓜地走进他的直播间要一起“看笑话”。@k总直播名场面抖音截图站长网2024-09-12 02:31:470000