Google在Contact Center AI中首次展示了更好的转录无尽的流媒体以及更多功能

去年7月，在旧金山举行的Cloud Next会议上，Google推出了Contact Center AI。机器学习支持的客户支持工具包利用Dialogflow(一种对话式体验开发平台)和Cloud Speech-to-Text(一套音频到文本技术)来通过电话与呼叫者进行交互。这已经是很长一段时间了，但是本周这家科技巨头通过大量功能大大增强了语音识别的准确性，从而为这一新生服务提供了支持。

产品经理Dan Aharon和Shantanu Misra在博客中写道：“联络中心对许多企业至关重要，正确的技术在帮助他们提供出色的客户服务方面发挥着重要作用。” “我们很高兴看到语音识别的这些改进如何改善各种形状和大小的联络中心的客户体验。

Contact Center AI的新自动语音适应功能(可在beta中使用)针对Dialogflow代理的语音识别系统可能会使发音相似的单词造成混淆的情况。它考虑了上下文，特别是训练短语，实体和其他特定于代理的信息，以便使用称为语音适应的学习过程进行适当响应。例如，如果呼叫者试图安排产品退货，那么Contact Center AI将利用其对退货流程的了解来避免将“邮件”一词误认为“钉子”。

默认情况下，自动语音适应功能处于关闭状态。您将在Dialogflow控制台中找到它。

基准模型改进

Google最近推出了针对特定用例的高级付费语音转文本预览模型，并于2月份推出了其中之一-一种针对两人或四人对话进行了优化的电话模型。当时，Mountain View公司声称该模型的转录错误比其前身的54%减少了62%。今天，Google透露，其工程师已针对美国英语中的简短发音进一步优化了该模型。与先前宣布的改进相比，该模型现在的准确性提高了15%。

Aharon和Misra写道：“应用语音自适应还可以在获得收益的基础上提供其他改进。” “我们一直在不断增加路线图的质量改进，这是对任何IVR或基于电话的虚拟代理的自动好处，无需更改任何代码-并将在未来共享更多有关这些更新的信息。”

更好的转录和无尽的流媒体

增强的上下文意识和增强的语音转文本并不是Contact Center AI管道上唯一的新自然语言理解改进。除了扩展的词组限制，无尽的流媒体等等，谷歌今天在Beta中首次发布了“更丰富的”手动速度适应和实体类。

SpeechContext参数中包含三项新功能，Cloud Speech-to-Text设置的集合以及用于根据企业和垂直行业的语言量身定制的切换开关。SpeechContext 类 -反映诸如数字序列，地址，数字和货币面额等概念的预构建实体-一次为一组单词优化ASR。至于SpeechContext boost，它可以帮助调整语音适应强度，同时减少误报的数量-即，当短语未提及但出现在笔录中时。最后，SpeechContext现在每个API请求最多支持5,000个短语提示(以前是500个)，从而增加了ASR捕获不常见单词或短语的可能性。

Google在Contact Center AI中首次展示了更好的转录无尽的流媒体以及更多功能

猜你喜欢

最新文章