加拿大一家公司Picovoice希望在所有边缘设备上甚至在Web浏览器中安装一个语音助手,以保证云级准确性。此过程包含三个部分-唤醒词,语音到文本翻译和语音到意图。Picovoice先前推出了Porcupine用于唤醒单词检测,Rhino则用于处理语音到意图,但是现在添加了Cheetah语音到文本翻译来完成三者。所有这些都可以通过GitHub获得。

该堆栈无需连接互联网即可在设备上实时运行,并保证极低的资源需求。Picovoice的目标是立即解决两个重要问题:隐私和资源需求。
语音助手流程通常很耗资源,并且与云相关。但是,围绕云连接存在大量的隐私问题。在这些页面中,我们讨论了大多数智能助手如何收集和存储您的语音数据,以及如何控制它。当然,苹果公司因其承包商如何收听Siri录音而备受抨击。
因此,对于注重隐私的人来说,必须让智能助手远离技术巨头拥有的麻烦后端。问题在于没有云支持就很难运行语音助手,但是Picovoice声称它的产品甚至可以在5美元的Raspberry Pi Zero上运行。它也可以直接在浏览器中运行,并且通常与平台无关。Picovoice创始人兼总裁Alireza Kenarsari-Anhari表示,例如,猎豹可以在iOS,watchOS,Android,Linux,macOS,Windows,Raspberry Pi,Beagle Bone和“所有现代网络浏览器”上运行。
低资源需求很重要,这不仅是因为计算资源通常限制在边缘设备上,还因为更高的需求会更快耗尽电池寿命。Picovoice减少资源需求的关键方法是保持事物特定于域。也就是说,您将电视和洗衣机使用不同的型号。这很直观。考虑一下手机上智能助手必须处理的可能性领域。当您使用唤醒词时,它不知道您是否要发送语音文本,询问歌曲,进行互联网搜索查询,设置会议或进行其他操作。它必须从一切的可能性开始。
相比之下,Picovoice的技术更深入了一个或两个层次。通过将给定的应用程序限制为特定的设备(例如咖啡机),可以减少可能数量级的请求,命令和操作。Picovoice声称,使用这种方法可以达到与Google和Amazon相同的准确性。
这样的想法是,品牌或公司可以使用Picovoice为客户创建自定义的语音体验。从表面上看,该成本比云服务后端要低得多,尽管尚不清楚硬成本-但看来它会根据具体情况进行大规模扩展。
Picovoice的直接竞争对手包括Mycroft,Snips和Sensory。但是Kenarsari-Anhari断言Mycroft没有自己的语音到文本引擎,而是使用第三方,并且Snips和Sensory比Picovoice需要更多的运行时资源,并且在更少的平台上工作。但是,它们确实保证了某些相同的隐私优势。
Picovoice已经有一些客户,尽管该公司除了命名“ LG”,“惠而浦”和“本地汽车”这几个名字外,并没有说出很多其他名字,但尚待讨论。

