图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用
深度学习
算法的一种实践应用。
[1]
现阶段
图像识别技术
一般分为
人脸识别
与
商品识别
,人脸识别主要运用在安全检查、身份核验与
移动支付
中;商品识别主要运用在
商品流通过程
中,特别是
无人货架
、智能零售柜等无人零售领域
[2]
。
图像的传统识别流程分为四个步骤:
图像采集
→
图像预处理
→
特征提取
→图像识别。
图像识别软件
国外代表的有
康耐视
等,国内代表的有图智能、海深科技等。另外在
地理学
中指将
遥感图像
进行分类的技术。
图形
刺激作用
于
感觉器官
,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。
图像识别技术的产生以及更新成为当下十分重要的发展方向,同时表现出了良好的发展前景,在信息收集、医疗以及产品安全等方面,都已经开始广泛运用图像识别技术,发挥了非常大的作用。
[4]
人的图像
识别能力
是很强的。图像距离的改变或图像在感觉器官上作用位置的改变,都会造成图像在
视网膜
上的大小和形状的改变。即使在这种情况下,人们仍然可以认出他们过去知觉过的图像。甚至图像识别可以不受
感觉通道
的限制。例如,人可以用眼看字,当别人在他背上写字时,他也可认出这个字来。
图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在
图像轮廓
曲度最大或轮廓方向突然改变的地方,这些地方的
信息量
最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。
在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的
信息加工
才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做
组块
,每一个组块是同时被感知的。在文字材料的识别中,人们不仅可以把一个汉字的笔划或偏旁等单元组成一个组块,而且能把经常在一起出现的字或词组成组块单位来加以识别。
在
计算机视觉
识别系统中,图像内容通常用
图像特征
进行描述。事实上,基于计算机视觉的
图像检索
也可以分为类似文本搜索引擎的三个步骤:提取特征、建索引build以及查询。
图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机
程序
,人们提出了不同的图像识别模型。例如
模板匹配模型
。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别
印刷体
的、
手写体
的、方向不正、大小不同的各种字母A。同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。
[1]
基于深度学习的图像识别研究
.中国知网.2019-06-10
[引用日期2019-08-09]
[2]
基于深度学习的商品图像识别方法研究
.中国知网.2018-06-04
[引用日期2019-08-09]
[3]
雅虎收购图像识别创业公司IQ Engine
.commernet
[引用日期2013-08-26]
[4] 聂莉娟.基于人工智能的图像识别研究[J].无线互联科技,2022,19(2):112-115
[5] 李丽亚.人工智能中图像识别技术的发现与应用研究[J].长江信息通信,2022,35(1):134-136