首页站长资讯Amazon Transcribe新一代语音基础模型驱动的ASR系统，支持100多种语言

Amazon Transcribe新一代语音基础模型驱动的ASR系统，支持100多种语言

站长网2023-11-27 10:01:170阅

# 划重点

1. 🎙️ **多语言支持:** Amazon Transcribe推出的新一代语音基础模型涵盖100多种语言，提供全面的自动语音识别（ASR）服务。

2. 🚀 **性能提升:** 利用语音基础模型，Amazon Transcribe在大多数语言中实现20%至50%的显著准确度提升，尤其在电话语音等挑战性领域中提高了30%至70%的准确度。

3. 🌐 **全面功能:** 新ASR系统支持多种特性，包括自动标点、自定义词汇、自动语言识别、说话人分离等，提供更准确的输出并有效嵌入语音技术。

亚马逊宣布推出全新一代语音基础模型驱动的ASR系统，将自动语音识别服务扩展到支持100多种语言。Amazon Transcribe是一项完全托管的ASR服务，使您能够轻松地将语音转换为文本，并在应用程序中添加语音到文本的功能。

新的语音基础模型是通过最先进的自监督算法训练而成，以学习跨语言和口音的人类语音的固有普遍模式。它经过数百万小时的未标记音频数据的训练，涵盖100多种语言。通过智能数据采样优化训练配方，平衡了不同语言之间的训练数据，确保传统上代表性不足的语言也能达到高准确度水平。

图源备注：图片由AI生成，图片授权服务商Midjourney

软件公司Carbyne是开发云端紧急呼叫响应解决方案的代表，通过Amazon Transcribe实现AI驱动的实时音频翻译，改善了对那些在家中使用非英语的6800万美国人以及每年访问该国的多达7900万外国游客的紧急响应。借助新的多语言基础模型，Carbyne将更好地实现紧急服务的民主化，确保每个人都能受益。

通过利用语音基础模型，Amazon Transcribe在大多数语言中实现了20%至50%的显著准确度提升。在电话语音等具有挑战性和数据稀缺领域，准确度提高了30%至70%。除了显著的准确度提升外，这一大型ASR模型还通过更准确的标点和大写提高了可读性。随着生成式AI的发展，成千上万的企业正在使用Amazon Transcribe从其音频内容中解锁丰富的见解。

新ASR系统提供了许多关键功能，涵盖100多种语言，包括使用方便、定制化、用户安全和隐私。这些功能包括自动标点、自定义词汇、自动语言识别、说话人分离、单词级置信度分数和自定义词汇过滤器。系统对不同口音、噪音环境和声学条件的支持扩展，使您能够产生更准确的输出，并有效地嵌入语音技术到您的应用程序中。

由于Amazon Transcribe在不同口音和噪音条件下的高准确性，支持多种语言，以及广泛的增值功能集，成千上万的企业将能够从其音频内容中解锁丰富的见解，提高其音频和视频内容在各个领域的可访问性和可发现性。例如，联系中心使用Amazon Transcribe转录和分析客户呼叫，以识别见解并随后提高客户体验和代理效率。内容制作者和媒体分销商使用Amazon Transcribe自动生成字幕，以提高内容的可访问性。

开始使用Amazon Transcribe非常简单，您可以使用AWS命令行界面（AWS CLI）、AWS管理控制台和各种AWS SDK进行批量转录，并继续使用相同的StartTranscriptionJob API从增强的ASR模型中获得性能优势，而无需在您的端口进行任何代码或参数更改。上传媒体文件到Amazon Simple Storage Service(Amazon S3)存储桶是第一步，该对象存储服务可从任何地方存储和检索任意量的数据。您可以选择将转录保存在自己的S3存储桶中，或者让Amazon Transcribe使用安全的默认存储桶。

Amazon Transcribe使用JSON表示其输出，提供两种不同的格式:文本格式和分项格式。根据创建转录作业时选择的功能，Amazon Transcribe创建转录结果的其他和丰富的视图。

在AWS的不断创新下，通过将Amazon Transcribe的语言支持扩展到100多种语言，我们使客户能够为来自不同语言背景的用户提供服务。这不仅提高了可访问性，还在全球范围内开辟了新的沟通和信息交流途径。要了解本文讨论的功能的更多信息，请查看功能页面和新功能帖子。

AmazonTranscribe新一代语音基础模型驱动的ASR系统支持100多种语言

0000

评论列表

共(0)条

相关推荐

站长资讯
黄仁勋有望超越马斯克成全球首富英伟达股价破千美元大关
站长之家（ChinaZ.com）5月28日消息:英伟达近日发布的最新财报成绩斐然，全面超越市场预期，公司市值和创始人黄仁勋的个人财富也随之飙升。财报公布后，英伟达股价首次突破1000美元关口，市值逼近2.6万亿美元，而黄仁勋的身价也高达910亿美元，成为全球第17位富豪。
站长网2024-05-28 17:05:08
0000
站长资讯
快递市场管理办法3月1日起施行未经用户同意放快递柜罚款最高3万元
站长之家（ChinaZ.com）1月5日消息:据交通运输部消息，《快递市场管理办法》已经通过并于2024年3月1日起施行。其中，新公布的《办法》特别强调，经营快递业务的企业未经用户同意，不得代为确认收到快件，也不得擅自将快件投递到智能快件箱、快递服务站等快递末端服务设施。
站长网2024-01-05 14:26:46
0000
站长资讯
Artifact 新闻应用程序强制 AI Snoop Dogg 为用户朗读新闻
据国外媒体报道，周四，Artifact新闻应用程序宣布将添加语音转文本功能，允许用户使用由Speechify提供支持的人工智能语音来收听文章。该更新应该免费提供给所有iOS用户，并且该功能应该会在不久的将来在Android上推出。
站长网2023-07-28 14:50:16
0000
站长资讯
ChatGPT 常被用来干什么？调查显示：近三成拿它来协助编程！
【CSDN编者按】ChatGPT自去年底一经出世便风靡全球，不管是专业人士、学生、开发者，或是创作者，各行各业似乎都使用过这款工具，访问量以及关于它的报道更是如洪水般骤增。不过，最近一段时间，很多人发现ChatGPT被提及的次数越来越少，这不免让有些人说是学生放假了、试一试就不再用了，还有人说炒作热度过去了“要凉了”，那么究竟是为什么呢?这篇文章将试图给出答案。
站长网2023-09-01 12:04:55
0000
任正非：我们即将进入第四次工业革命规模之大不可想象
快科技9月19日消息，近日，ICPC基金会主席及教练和世界计算机竞赛的金牌获得者前往华为考察。在此期间，华为创始人任正非表示，我们即将进入第四次工业革命，波澜壮阔，其规模之大不可想象。在任正非看来，第四次工业革命的基础就是大算力，今天的年青人是未来大算力时代的领袖，我们支持竞赛的目的是要为年青人搭建一个绽放生命火花的舞台。
站长网站长资讯2023-09-19 21:00:07
0000