YouTube产品经理Liat Kaver表示:“我预见了所有字幕都将被制作成字幕的未来,这样,像我这样的3亿聋哑或听障人士将可以像其他所有人一样欣赏视频。” 可访问性。“当我在哥斯达黎加长大时,我的母语没有隐藏式字幕,只有英语电影带有西班牙语字幕。我觉得自己很想念,因为我经常不得不猜测屏幕上正在发生的事情,或者在脑海中编造自己的故事版本。那就是可以自动为任何视频生成高质量字幕的系统的梦想诞生的地方。”

Google 于2006年首次推出了视频字幕选项,随后于2009年推出了自动字幕。现在支持 10种语言的字幕。
随着YouTube的发展,带字幕的视频数量也已超过10亿。Kaver表示,启用字幕后,每天观看的视频超过1500万。
Kaver说:“我们能够扩展字幕可用性的方法之一是将Google的自动语音识别(ASR)技术与YouTube字幕系统相结合,以提供视频的自动字幕。” “这项技术存在局限性,凸显了需要改进字幕本身。结果有时不尽人意,促使一些创作者以我们为代价来找点乐子!”
Kaver表示,他们团队的主要目标之一是通过语音识别,机器学习和培训数据增加方面的技术改进来提高自动字幕的准确性。她说:“总的来说,这些技术上的努力使英语自动字幕的准确性提高了50%,这使我们越来越接近人类转录错误率,” “我从第一手经验中知道,如果您以无障碍获取为指导进行构建,那么您就可以使技术为所有人所用。”

