正如我们在其他文章中看到的,自动语音识别 技术使用设备和软件来识别和处理口头语言,就像它可以用来通过声音验证一个人的身份一样。自动语音识别 无处不在,从 上的自动字幕到和 等虚拟助手。 然而,尽管近年来这项技术取得了重大进展,但它并不总能提供准确的结果。在语音识别过程及其随后的文本翻译过程中,某些单词可能会被遗漏或错误翻译。简而言之,这就是“单词错误率”,在西班牙语中可以翻译为“单词错误率”。 在本文中,我们将详细定义 WER 是什么以及为什么在准确评估。
您考虑在呼叫中
什么是错误? 词错误率 (WER) 是衡量语音到文本准确性的常用指标。WER 评估语音识别的准确性,它是转录中发生的错误数量相对于所说单词总数的指标。 要计算 WER,请将错误总数(替换、插入和删除 荷兰电话号码列表 的总和)除 说的单词总数。此度量基于距离,它衡量转录本中两个单词字符串之间的差异。例如,如果一份 36 字的电话通话记录有 9 个错误,则 将为 %。较低的 WER 通常表示 软件的精度较高,而较高的 表示精度较低。 然而,有几个局限性。
因为它没有考虑错误的来源
例如录音质量、背景噪音、麦克风质量、行业特定或技术术语以及说话者发音。此外,WER没有考虑到单词对于转录的特定目的的重要性。尽管一份成绩单的 可能较低,但如果省略相关关键字进行分析,它可能用处不大,就像一些 相对较高的系统可能会在特定上下文中产生有用的数据一样。因此,重要的是要考虑语音识映您和得不 美國B2B列表 多次使如何处理数据以及哪些词对于转录目的很重要。 WER 如何减少呼叫错误? 为了减少呼叫中心的呼叫错误,确性。如果 很了很多错误。