开源语音转字幕软件Whisper 可识别多种语种
Open AI 于2022年9月21日开源了名为 Whisper 的神经网络。该神经网络声称其英文语音辨识能力已达到人类水平,并且还支持其他98种语言的自动语音辨识。Whisper 系统的自动语音辨识模型经过训练,能够将各种语言的语音转化为文本,并将这些文本翻译成英文。
项目地址:https://github.com/openai/whisper
Whisper 的核心功能是语音识别。对于学生和工作人员来说,它可以帮助快速将会议、讲座、课堂录音整理成文字稿。对于影视爱好者来说,它可以自动生成无字幕资源的字幕,无需等待字幕组发布字幕。对于外语口语学习者来说,使用 Whisper 翻译发音练习录音可以检验口语发音水平。
与一些商业公司提供的联网语音识别服务不同,Whisper 完全在本地运行,无需联网,充分保障个人隐私,并且具有高准确率。以我自己录制的一段音频为例,长度为5分钟,约400多个字,使用 Whisper 的中等模式进行识别,仅有两个英文单词识别错误,而这两个错误是由于发音问题导致的。
下载 Whisper 模型的方式是使用 Const-me 项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:https://github.com/BtbN/FFmpeg-Builds/releases
核心功能:
多语种语音识别:Whisper 可以准确识别多种语种的语音输入,包括英语和其他语种。
语音翻译:用户可以使用 Whisper 将输入的非英语语音实时翻译成英语文本。
语言识别:Whisper 能够自动检测输入语音的语种,并进行相应的处理和识别。
多任务处理:Whisper 可以同时处理多项语音处理任务,取代传统语音处理流程的多个阶段。
高鲁棒性:Whisper 在大规模多样化的语音数据集上进行训练,具有较强的鲁棒性和准确性。
可能不是“Switch 2”!任天堂新硬件或采用全新设计
快科技5月14日,随着近日任天堂现任社长在电话会议中透露新的主机硬件已经进入开发,关于Switch2”的消息又迎来了一波新的热潮。但近日,gamesindustry发布文章,称任天堂的新硬件可能并不会沿用Switch的设计,而是会采用全新设计。gamesindustry表示,从最新的财报信息来看,任天堂需要的是一个继任者,需要一个能够带领任天堂进入全新篇章的产品。站长网2023-05-14 15:33:320000雷军回应王腾在公司玩黑神话:他说测试游戏本
今天中午12:00,小米公司CEO雷军在他的第二期“雷军的副驾”直播节目中,邀请了知名汽车博主“极速拍档Jacky”作为嘉宾,共同分享了驾驶小米SU7的体验和乐趣。在轻松愉快的氛围中,他们不仅讲述了SU7与广东的联系,还透露了小米汽车业务的最新进展。站长网2024-08-22 14:00:020000美国佐治亚州立法者准备研究人工智能发展及潜在风险
伍德斯托克的共和党国会议员布拉德·托马斯(BradThomas)与备受瞩目的人工智能聊天机器人ChatGPT进行了交流,并成为佐治亚州人工智能发展小组委员会主席。尽管他对ChatGPT的初步尝试印象深刻,但也意识到其存在一些问题。站长网2023-07-03 18:21:360000Animate Anyone引发人们对虚假视频泛滥的担忧
要点:由阿里巴巴智能计算研究所研发的“AnimateAnyone”是一种新的生成视频技术,能够将静态图像转换为高度逼真的动态深度伪造视频。该技术改进了之前的图像到视频系统,解决了以往存在的幻觉问题,使生成的视频更为逼真,尽管仍存在一些问题,尤其是在处理眼睛和手部动作方面。站长网2023-12-05 10:27:310000爽文短剧到底有多赚?到了横店我差点想入伙。
他,衣着寒酸,被众人鄙视,被妻子狂扇巴掌,被逐出家门。而今,三年之期已到,他不再隐忍。在大家惊诧下,他的真实身份被揭晓:龙王、修罗、战神、罗刹、药神、虎帅。。。称号包括且不限于以上六种。这就是2020年最火的短剧类型,赘婿。当年的歪嘴战神,靠耐克笑养活了一大票鬼畜区up,也让短剧这个概念彻底出圈。如今又是三年之期已到,短剧也已经摇身一变,成了最当红的炸子鸡。站长网2023-11-17 09:17:510001