Pika推出Lip Sync功能 支持视频人物嘴部动画和音频同步
站长网2024-02-28 10:23:270阅
创新视频生成工具Pika最近推出了一项名为Lip Sync的新功能。这项功能旨在帮助用户在生成视频中实现嘴部动画和音频的同步,从而提供更加生动和逼真的视频体验。该功能目前仅Pika Pro用户可以体验,Pika Pro 用户订阅费为每月 58 美元。
据了解,该功能由ElevenLabs提供支持,用户可以选择直接输入文字生成音频,也可以上传自己的音频。也就是说用户可以自己决定视频角色要说什么话,以及用什么声音风格说话,无疑为用户的视频创作提供了更多的可能性。

产品入口:https://top.aibase.com/tool/pika
在此之前,Pika已经推出了一系列其他的功能,以增强其视频编辑能力。其中,视频画面扩充功能就是一个例子。用户只需点击Expand Canvas功能按钮,就可以在原画面基础上扩充画面,使得视频内容更加丰富。
除此之外,Pika还支持调整视频风格。用户只需要点击编辑按钮,输入他们想要的风格提示,就可以轻松切换视频的风格。例如,如果用户想要生成一个可爱的动漫风格的视频,他们只需要点击编辑按钮,输入“a girl with a horse,3d animation”,就可以生成动漫效果的视频了。
总的来说,Pika的这些功能,无论是新推出的Lip Sync,还是之前的视频画面扩充和风格调整,都极大地增强了用户的视频创作能力,使得他们可以更轻松地制作出生动、有趣、富有创意的视频。
0000
评论列表
共(0)条相关推荐
俄罗斯AI机器人YandexGPT2考入大学 完成文学统考所有任务
YandexGPT2神经网络的人工智能创建者在接受俄罗斯公报(RG)采访时宣布,YandexGPT2神经网络已成功通过俄罗斯统一国家考试(EGE),并获得足够的分数进入大学。Yandex团队表示,这标志着俄罗斯首次生成神经网络能够通过考试并完成所有任务,包括创造性任务。他们指出,这一事件证明人工智能参与教育是必然的,考试和其他知识评估的方式必须做出调整。站长网2023-10-16 10:48:310000重庆首个自主研发的大语言模型“兆言”发布
7月13日,上海交通大学重庆人工智能研究院在西部(重庆)科学城发布其最新研发成果“兆言”大模型产品。据了解,兆言大模型是上海交大重庆人工智能研究院基于全球领先的AI大模型技术研发出的最新成果,它的建立是通过积累海量数据,辅以独特的数据处理和AI训练技术,以达到精准、专业的文本输出,并且能够实现以自然语言选择、调用应用程序的能力,助力打造个性化的智能产品。站长网2023-07-14 16:31:090000听10秒语音就能判断糖尿病,这个AI大模型太硬核了!
加拿大的Klick科研人员在顶级健康杂志《梅奥诊所文集:数字健康》上发布了一个AI大模型,只需要听一段6—10秒的语音,就能诊断是否患有2型糖尿病(T2DM)。目前糖尿病的主要检测方式依赖于血糖测量,但这种方法需要获取血液样本对患者会造成创伤,同时还需要专业设备成本非常高。为了解决这一检测痛点,加拿大知名健康科技公司Klick科研人员提出了AI模型检测方法。站长网2023-11-13 21:47:360000Google发布PaLI-3视觉语言模型,性能相当于体积大10倍的模型
📌划重点:GoogleResearch和GoogleDeepMind发布了PaLI-3,这是一款仅有50亿参数的视觉语言模型(VLM)。尽管相对较小,PaLI-3在多模态测试中超越了体积大10倍的模型,可以回答关于图像的问题、描述视频、识别对象和读取图像上的文本。站长网2023-10-25 18:22:020000谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性
近日,GoogleGemini1.5推出了一项令人瞩目的技术突破,该版本引入了一个拥有高达一百万个令牌的上下文窗口功能。这项新功能旨在处理完整的书籍甚至电影,其准确性关注。尽管Gemini1.5的上下文窗口容量庞大,但可能仍存在不准确再现信息的可能性。在“海底捞针”测试中,该系统需要提取多达100条特定信息,但平均准确度仅在60%至70这项任务相对于复杂文档的摘要撰写而言仍然要简单一些。站长网2024-02-21 09:26:370000