机器视觉识别技术的现状和未来

02zz · 发表于 2019-11-1 16:20:19

移动互联网、智能手机以及社交网络的发展带来了海量图片信息，伴随着图片成为互联网中的主要信息载体，难题随之出现。当信息由文字记载时，我们可以通过关键词搜索轻易找到所需内容并进行任意编辑。而当信息是由图片记载时，我们却无法对图片中的内容进行检索，从而影响从图片中找到关键内容的效率。

图片给我们带来了快捷的信息记录和分享方式，却降低了我们的信息检索效率。在这个环境下，计算机的机器视觉识别技术就显得尤为重要。机器视觉识别是计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术，识别过程包括图像预处理、图像分割、特征提取和判断匹配。

借助机器视觉识别技术，不仅可以通过图片搜索更快的获取信息，还可以产生一种新的与外部世界交互的方式，甚至让外部世界更加智能的运行。随着图形识别技术的不断进步，越来越多的科技公司开始涉及图形识别领域，这标志着读图时代正式到来，并且将引领我们进入更加智能的未来。

机器视觉识别的初级阶段

在这个初始阶段，用户主要是借助机器视觉识别技术来满足某些娱乐化需求。如百度研发的图片搜索可以找到相似的图片；Facebook研发根据相片进行人脸匹配的DeepFace；IQ Engine开发的Glow可以通过机器视觉识别自动生成照片的标签以帮助用户管理手机上的照片。

这个阶段还有一个非常重要的细分领域——OCR（Optical Character Recognition，光学字符识别），是指光学设备检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别的方法将图像形状翻译成计算机文字的过程，就是计算机对文字的阅读。

在这个阶段，机器视觉识别技术仅作为辅助工具存在，为人类视觉提供了强有力的辅助和增强，带给了我们一种全新的与外部世界进行交互的方式，如将人脸识别作为主要的身份认证方式等。这个过程就可以简化为：人眼借助机器捕捉目标信息、机器和互联网直接对信息进行分析并返回结果。

机器视觉识别的高级阶段

目前的机器视觉识别技术是作为一个工具来帮助我们与外部世界进行交互，只提供辅助作用，所有的行动还需我们自己完成。而当机器真正具有了视觉之后，机器不仅可以对外部信息进行获取和分析，还完全有可能代替我们去完成这些行动。

机器视觉之于人工智能的意义就是视觉之于人类的意义，而决定着机器视觉的就是机器视觉识别技术。在某些应用场景，机器视觉比人类的生理视觉更具优势，更加的准确、客观和稳定。人类视觉有着天然的局限，似乎能详细生动的感知整个视觉场景，但这是一个错觉，只有投射到眼球中心的视觉场景的中间部分，我们才能详细而色彩鲜明的看清楚。

机器在这方面就有着更多的优势，它们能够发现和记录视力所及范围内发生的所有事情。拿视频监控来说，传统监控需要有人在电视墙前时刻保持高度警惕，然后再通过自己对视频的判断来得出结论，但往往会因为人的疲劳、视觉局限和注意力分散等原因影响监控效果。但有了成熟的机器视觉识别技术之后，计算机就可以自行对视频进行分析和判断，发现异常情况直接报警，带来了更高的效率和准确度。

机器视觉识别技术的现状和未来

相关文章