说到人工智能,大家肯定都不陌生,办银行卡或者高铁出行的人脸识别,当然这只是应用案例的一小部分,未来图像识别将广泛应用于各行各业,虽然现在图像识别技术还有待完善,但是图像识别从提出到现在已经50多个年头,才在这几年真正走进寻常百姓的生活。
图像识别的萌芽
1966年,Minsky教授布置了一个暑假作业:通过编程让计算机告诉我们它通过摄像机看见什么。虽然不知道这些学生的内心是怎么想的,但是50多年,这个暑假作业也没有真正完成...
1970-1980 三维重构和先验知识库
到了上世纪七八十年代,因为现代电子计算机的出现,人工智能也有了新的突破。研究者们提出了2中设想:三维重构 和 先知知识库。
“三维重构”
简单来说就是将“二维图像”恢复成三维结构。
当时人们普遍认为,人类能看到并理解事物是因为通过两只眼睛可以立体地观察事物。因此要想让计算机理解它所看到的图像,必须先将事物的三维结构从二维的图像中恢复出来。(现在看来是极大的误解……)
“先验知识库”
提取事物的基本特征,建立一个这样的数据库,将机器看到的图像和数据中的信息比对,输出与之匹配出的数据库信息。这个方法可行,但是实用性不高,只能应用于OCR、工件识别等。
1990 统计方法和局部特征描述符
1990s 图像处理硬件技术的提升,计算机视觉技术也有了大幅提升,能够获取更加精确的图像信息。既然“先验知识库”不精确,那么可以通过事物的局部特征来精确,引入局部特征描述符,建立相关检索,就可以准确匹配。
21世纪 机器学习方法的广泛应用
互联网技术兴起以及数码相机的出现提供了海量的数据, 以往很多基于规则的处理方式被机器学习所代替,机器将海量数据中进行分类、定位、监测、分割,自动总结归纳物体特征,然后进行识别和判断。
2010年 神经网络图像识别的时代
神经网络图像识别是目前比较新的图像识别技术了,腾讯的深度学习技术更是极大的降低了图像识别的误判率。现在,人脸识别甚至能做到误判率低于百万分之一,原理和人脑的图片识别原理相近,相信不久的未来将拥有超人类的图像识别能力。
现在图像识别已经广泛应用于各类软件中,但是只有少数巨头公司才拥有图像识别等专利,软件公司都是借用大佬们的先进技术,直接购买相应服务,实现多种智能识别功能的。