阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。
项目地址:https://github.com/alibaba-damo-academy/FunClip
在线演示:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
FunClip的主要特点
语音识别:使用阿里巴巴的FunASR Paraformer-Large模型,确保了剪辑的精准性。
操作简便:用户可以根据识别的语音内容选择文本片段或说话人进行视频裁剪。
语言支持:目前支持中文,未来将扩展支持英文视频剪辑。
FunASR工具包介绍
FunASR是阿里巴巴通义实验室开发的一款综合性语音识别工具包,提供端到端的语音识别解决方案和一系列开源的、性能优越的预训练模型。它支持以下功能:
语音识别(ASR):提供非自回归端到端语音识别模型,支持多任务处理。
语音活动检测(VAD)与标点恢复:通过预训练模型进行有效的语音活动区段检测,提供标点恢复功能。
模型动态部署与优化:支持预训练模型的微调和推理,提供文件转录和实时转录服务。
项目地址:https://github.com/alibaba-damo-academy/FunASR
论文:https://arxiv.org/abs/2305.11013
Paraformer模型
Paraformer是阿里巴巴达摩院语音团队开发的非自回归端到端语音识别模型,专为高效的GPU并行推理设计。它提供快速且准确的语音到文本的转换,特别适合处理长音频。Paraformer模型的核心特点包括:
高效的模型架构:采用多种网络结构和优化目标,提供高效率和准确度。
功能拓展:支持热词定制版模型和长音频模型,适用于多种应用场景。
应用场景:适用于语音输入法、语音导航、智能会议纪要等多种应用场景。
FunClip的开源为视频内容创作者和编辑者提供了一个强大的工具,使得视频剪辑更加智能化和自动化。同时,FunASR工具包和Paraformer模型的开源,也为语音识别领域的研究和应用提供了宝贵的资源。阿里巴巴通过这些开源项目,展示了其在AI技术领域的领导地位和对开放创新的承诺。
Paraformer模型地址:https://modelscope.cn/models/iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary
贾跃亭计划两年内回国:称还有20亿美元债务
法拉第未来(FF)的创始人贾跃亭在与NOUS的对话中首次公开复盘了乐视和FF的创业经历,并分享了他的回国计划。自2014年离开中国赴美造车以来,贾跃亭一直未能回国,而"下周回国贾跃亭"也成了网上的著名段子。0000小米小爱同学上线“电子木鱼”功能
近日,小米小爱同学官方宣布上线了“电子木鱼”功能,并称之为更适合打工人体质的放松神器。它能够自动敲击木鱼,省去繁琐的操作,让用户可以更轻松地积攒“功德N”。使用方法非常简单,只需要对小米手机或小米平板上的小爱同学说“敲木鱼”即可试玩。点击电子木鱼图案,就可以开始敲击和积攒赛博功德。据介绍,电子木鱼敲击的声音属于白噪音,这种声音重复、单调、规律,最初被运用在心理治疗中。站长网2023-07-10 16:49:190000Meta 在关键的欧盟选举之前加大打击虚假信息的力度
**标题:****划重点:**1.🌐**欧洲选举前行动**:Meta发布详细计划,设立欧盟选举行动中心,扩大事实核查伙伴网络,开发工具识别并标记AI生成内容。2.🤔**专家担忧**:虽然Meta加强对抗谣言的计划,但专家表示存在"严重限制",尤其对付源自中国的协同影响活动的能力有所不足。站长网2024-02-27 10:18:110000MetaHuman:一键创建超逼真数字人 无需高配置硬件
MetaHuman是一个创造高度逼真的数字人类角色的框架,它具备完整绑定和动画制作功能。使用MetaHumanCreator,用户可以快速、直观地创建逼真的数字人类角色。而MetaHumanAnimator则可以复制面部表演并实现高保真动画,无需高配置的硬件。用户可以在虚幻引擎中使用MetaHuman,并利用先进的角色技术进行创作。站长网2023-08-09 20:02:570002特斯拉发布2023年全年财报:营收967.73亿美元 同比增长19%
站长之家(ChinaZ.com)1月25日消息:特斯拉公布了2023年的全年财报。报告显示,该公司在2023年总营收达到967.73亿美元,同比增长19%。其中,第四季度营收为251.67亿美元,同比增长3%。站长网2024-01-25 08:51:300000