阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。

项目地址:https://github.com/alibaba-damo-academy/FunClip
在线演示:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
FunClip的主要特点
语音识别:使用阿里巴巴的FunASR Paraformer-Large模型,确保了剪辑的精准性。
操作简便:用户可以根据识别的语音内容选择文本片段或说话人进行视频裁剪。
语言支持:目前支持中文,未来将扩展支持英文视频剪辑。
FunASR工具包介绍
FunASR是阿里巴巴通义实验室开发的一款综合性语音识别工具包,提供端到端的语音识别解决方案和一系列开源的、性能优越的预训练模型。它支持以下功能:
语音识别(ASR):提供非自回归端到端语音识别模型,支持多任务处理。
语音活动检测(VAD)与标点恢复:通过预训练模型进行有效的语音活动区段检测,提供标点恢复功能。
模型动态部署与优化:支持预训练模型的微调和推理,提供文件转录和实时转录服务。
项目地址:https://github.com/alibaba-damo-academy/FunASR
论文:https://arxiv.org/abs/2305.11013
Paraformer模型
Paraformer是阿里巴巴达摩院语音团队开发的非自回归端到端语音识别模型,专为高效的GPU并行推理设计。它提供快速且准确的语音到文本的转换,特别适合处理长音频。Paraformer模型的核心特点包括:
高效的模型架构:采用多种网络结构和优化目标,提供高效率和准确度。
功能拓展:支持热词定制版模型和长音频模型,适用于多种应用场景。
应用场景:适用于语音输入法、语音导航、智能会议纪要等多种应用场景。
FunClip的开源为视频内容创作者和编辑者提供了一个强大的工具,使得视频剪辑更加智能化和自动化。同时,FunASR工具包和Paraformer模型的开源,也为语音识别领域的研究和应用提供了宝贵的资源。阿里巴巴通过这些开源项目,展示了其在AI技术领域的领导地位和对开放创新的承诺。
Paraformer模型地址:https://modelscope.cn/models/iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary
33岁女作家用ChatGPT创作小说获日本顶级文学奖
要点:1、33岁女作家RieKudan用AI创作的小说《东京共鸣塔》获得了日本顶级文学奖「芥川奖」。2、评委对小说的一致评价是「几乎完美无瑕」,然而使用AI参与创作引发争议。3、在创意领域使用生成式AI的争议仍然存在,包括版权问题和对传统创作者的影响。站长网2024-01-29 09:33:580001亚马逊欲增加类ChatGPT电商搜索 正在招高级软件程序改进工程师
据媒体报道,OpenAI训练的ChatGPT人工智能聊天机器人受到推崇,多家公司已经将此技术应用到相关产品当中。微软将OpenAI的大语言模型引入必应搜索引擎,谷歌推出最新的人工智能语言模型“PaLM2”。站长网2023-05-17 10:39:500000这个五一,婚礼人“赚”不动了
“五一只订出去2号一场,其余全空。”“今年五一,没人结婚吗?”最近,社交平台上,不少从业者发帖感慨,今年五一是婚礼人的淡季。往年可不是这种情景,想抢占五一假期的新人们,不仅需要提前半年甚至一年开始预约,还要面临各个环节的层层涨价。有数据显示,往年五一、十一假期,全国婚庆的涨价幅度约15%-20%。0000知乎“倒爷”,折射文字社区20年浮沉
“在领悟什么道理后,你的人生开始轻松起来?”“什么算是人生的顶级享受?”“你最意外的一笔收入是什么?”这些高赞问答经过一批知乎「倒爷」截图发上小红书,零成本吸引流量,运营得风生水起。一天数篇,这样经过检验的优质内容总会有一篇被大数据送到合适的受众手中,分分钟浏览量破万、点赞破千。0000真我realme GT6发布:售价2799元起
真我GT6手机在7月9日举行了发布活动,正式与消费者见面。这款手机以其卓越的性能和显示技术成为市场上的热点。价格方面,真我GT6提供了多个版本,12GB256GB版定价2799元,16GB256GB版3099元,16GB512GB版3399元,而顶配的16GB1TB版售价为3899元。站长网2024-07-09 17:21:010000