过去一年,谷歌镜头一直在改变智能手机用户在设备上使用摄像头的方式。使用深度机器学习来分析图像。通过采集设备的摄像头,该应用程序可以执行任务。当你告诉你喜欢书封面上的照片,并找到一个商店或区域时,指向一个标签,通过查看他们的照片或连接到无线网络摄像头来显示登录数据。
在一篇新的博客文章中,谷歌给出了上周推出的谷歌镜头重新设计的更多细节。一个主要特征是基于视觉信息而不是文本信息的搜索能力。所以,也许你看到一只可爱的狗,你想知道它是什么品种。使用传统的基于文本的搜索,你必须找到一个单一的狗品种并比较图像,或者找到一个完整的狗品种列表,并希望找到合适的狗品种。有了谷歌镜头,你可以用相机捕捉狗狗的图像,让谷歌从图像中识别出狗狗的品种。
同样,您也可以从图像中搜索以识别具有相似样式的项目。如果你看到一个机构,你出去散步的时候喜欢,或者家里的装修像一盏漂亮的灯,那么你就可以用镜头捕捉到图像,这样不仅会搜索到原来的项目,还会搜索到风格相同的类似项目。这个过程是通过机器学习算法来完成的,该算法在互联网上搜索数亿张图片,提取特定物品的显著视觉特征,这样相机就可以从一张图片中同时识别出一个物品和其他类似的物品。
Lens面临的挑战之一是如何处理文本。教相机理解文本需要一种叫做光学字符识别(OCR)的功能,它允许相机识别书写的字符,即使它们是不同的字体、角度、非最佳颜色或光线。有了更新的光学字符识别镜头,您现在可以使用相机将文本从物理文件复制并粘贴到手机上。
谷歌打赌,随着智能手机拥有更好的摄像头,我们将越来越多地使用它们,不仅作为数字设备,还作为与现实世界互动的工具。

