找回密码
 立即注册
搜索

人工智能-图像辨认




图像辨认技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像辨认技术的看法越来越深入。图像辨认技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像辨认技术的引入、其技术原理以及形式辨认等,之后引见了神经网络的图像辨认技术和非线性降维的图像辨认技术及图像辨认技术的运用。从中可以总结出图像处理技术的运用广泛,人类的生活将无法分开图像辨认技术,研讨图像辨认技术具有严重意义。

1、图像辨认技术的引入

图像辨认是人工智能的一个重要范畴。图像辨认的发展阅历了三个阶段:文字辨认、数字图像处理与辨认、物体辨认。图像辨认,顾名思义,就是对图像做出各种处理、分析,最终辨认我们所要研讨的目的。明天所指的图像辨认并不只仅是用人类的肉眼,而是借助计算机技术停止辨认。虽然人类的辨认才能很弱小,但是对于高速发展的社会,人类本身辨认才能曾经满足不了我们的需求,于是就产生了基于计算机的图像辨认技术。这就像人类研讨生物细胞,完全靠肉眼观察细胞是不理想的,这样自然就产生了显微镜等用于准确观测的仪器。通常一个范畴有固有技术无法处理的需求时,就会产生相应的新技术。图像辨认技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,处理人类无法辨认或者辨认率特别低的信息。

1.1 图像辨认技术原理

其实,图像辨认技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实际中得到启示而应用程序将其模拟完成的。计算机的图像辨认技术和人类的图像辨认在原理上并没有本质的区别,只是机器短少人类在感觉与视觉差上的影响罢了。人类的图像辨认也不单单是仰仗整个图像存储在脑海中的记忆来辨认的,我们辨认图像都是依托图像所具有的本身特征而先将这些图像分了类,然后经过各个类别所具有的特征将图像辨认出来的,只是很多时分我们没无看法到这一点。当看到一张图片时,我们的大脑会迅速感应到能否见过此图片或与其相似的图片。其真实“看到”与“感应到”的中间阅历了一个迅速辨认过程,这个辨认的过程和搜索有些相似。在这个过程中,我们的大脑会根据存储记忆中曾经分好的类别停止辨认,查看能否有与该图像具有相反或相似特征的存储记忆,从而辨认出能否见过该图像。机器的图像辨认技术也是如此,经过分类并提取重要特征而扫除多余的信息来辨认图像。机器所提取出的这些特征有时会非常分明,有时又是很普通,这在很大的程度上影响了机器辨认的速率。总之,在计算机的视觉辨认中,图像的内容通常是用图像特征停止描画。

1.2 形式辨认

形式辨认是人工智能和信息迷信的重要组成部分。形式辨认是指对表示事物或现象的不同方式的信息做分析和处理从而得到一个对事物或现象做出描画、辨认和分类等的过程。

计算机的图像辨认技术就是模拟人类的图像辨认过程。在图像辨认的过程中停止形式辨认是必不可少的。形式辨认本来是人类的一项基本智能。但随着计算机的发展和人工智能的兴起,人类本身的形式辨认曾经满足不了生活的需求,于是人类就希望用计算机来代替或扩展人类的部分脑力休息。这样计算机的形式辨认就产生了。简单地说,形式辨认就是对数据停止分类,它是一门与数学严密结合的迷信,其中所用的思想大部分是概率与统计。形式辨认次要分为三种:统计形式辨认、句法形式辨认、模糊形式辨认。

2、图像辨认技术的过程

既然计算机的图像辨认技术与人类的图像辨认原理相反,那它们的过程也是大同小异的。图像辨认技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。

信息的获取是指经过传感器,将光或声响等信息转化为电信息。也就是获取研讨对象的基本信息并经过某种方法将其转变为机器可以看法的信息。

预处理次要是指图像处理中的去噪、平滑、变换等的操作,从而加强图像的重要特征。

特征抽取和选择是指在形式辨认中,需求停止特征的抽取和选择。简单的了解就是我们所研讨的图像是各式各样的,假如要应用某种方法将它们区分开,就要经过这些图像所具有的本身特征来辨认,而获取这些特征的过程就是特征抽取。在特征抽取中所得到的特征也许对此次辨认并不都是有用的,这个时分就要提取有用的特征,这就是特征的选择。特征抽取和选择在图像辨认过程中是非常关键的技术之一,所以对这一步的了解是图像辨认的重点。

分类器设计是指经过训练而得到一种辨认规则,经过此辨认规则可以得到一种特征分类,使图像辨认技术可以得到高辨认率。分类决策是指在特征空间中对被辨认对象停止分类,从而更好地辨认所研讨的对象详细属于哪一类。

3、图像辨认技术的分析

随着计算机技术的迅速发展和科技的不断提高,图像辨认技术曾经在众多范畴中得到了运用。2015年2月15日新浪科技发布一条旧事:“微软最近公布了一篇关于图像辨认的研讨论文,在一项图像辨认的基准测试中,电脑系统辨认才能曾经超越了人类。人类在归类数据库Image Net中的图像辨认错误率为5.1%,而微软研讨小组的这个深度学习系统可以达到4.94%的错误率。”从这则旧事中我们可以看出图像辨认技术在图像辨认方面曾经有要超越人类的图像辨认才能的趋向。这也阐明将来图像辨认技术有更大的研讨意义与潜力。而且,计算机在很多方面的确具有人类所无法超越的优势,也正是由于这样,图像辨认技术才能为人类社会带来更多的运用。

3.1神经网络的图像辨认技术

神经网络图像辨认技术是一种比较新型的图像辨认技术,是在传统的图像辨认方法和基础上交融神经网络算法的一种图像辨认方法。这里的神经网络是指人工神经网络,也就是说这种神经网络并不是动物本身所具有的真正的神经网络,而是人类模拟动物神经网络后人工生成的。在神经网络图像辨认技术中,遗传算法与BP网络相交融的神经网络图像辨认模型是非常经典的,在很多范畴都有它的运用。在图像辨认系统中应用神经网络系统,普通会先提取图像的特征,再应用图像所具有的特征映射到神经网络停止图像辨认分类。以汽车拍照自动辨认技术为例,当汽车经过的时分,汽车本身具有的检测设备会有所感应。此时检测设备就会启用图像采集安装来获取汽车正反面的图像。获取了图像后必须将图像上传到计算机停止保存以便辨认。最后车牌定位模块就会提取车牌信息,对车牌上的字符停止辨认并显示最终的结果。在对车牌上的字符停止辨认的过程中就用到了基于模板婚配算法和基于人工神经网络算法。

3.2非线性降维的图像辨认技术

计算机的图像辨认技术是一个异常高维的辨认技术。不管图像本身的分辨率如何,其产生的数据常常是多维性的,这给计算机的辨认带来了非常大的困难。想让计算机具有高效地辨认才能,最直接有效的方法就是降维。降维分为线性降维和非线性降维。例如主成分分析(PCA)和线性奇特分析(LDA)等就是常见的线性降维方法,它们的特点是简单、易于了解。但是经过线性降维处理的是全体的数据集合,所求的是整个数据集合的最优低维投影。经过验证,这种线性的降维策略计算复杂度高而且占用相对较多的工夫和空间,因此就产生了基于非线性降维的图像辨认技术,它是一种极其有效的非线性特征提取方法。此技术可以发现图像的非线性结构而且可以在不毁坏其本征结构的基础上对其停止降维,使计算机的图像辨认在尽量低的维度上停止,这样就提高了辨认速率。例如人脸图像辨认系统所需的维数通常很高,其复杂度之高对计算机来说无疑是宏大的“灾难”。由于在高维度空间中人脸图像的不平均分布,使得人类可以经过非线性降维技术来得到分布紧凑的人脸图像,从而提高人脸辨认技术的高效性。

3.3 图像辨认技术的运用及前景

计算机的图像辨认技术在公共安全、生物、工业、农业、交通、医疗等很多范畴都有运用。例如交通方面的车牌辨认系统;公共安全方面的人脸辨认技术、指纹辨认技术;农业方面的种子辨认技术、食品质量检测技术;医学方面的心电图辨认技术等。随着计算机技术的不断发展,图像辨认技术也在不断地优化,其算法也在不断地改进。图像是人类获取和交换信息的次要来源,因此与图像相关的图像辨认技术必定也是将来的研讨重点。当前计算机的图像辨认技术很有能够在更多的范畴崭露头角,它的运用前景也是不可限量的,人类的生活也将愈加离不开图像辨认技术。

图像辨认技术虽然是刚兴起的技术,但其运用已是相当广泛。并且,图像辨认技术也在不断地长大,随着科技的不断提高,人类对图像辨认技术的看法也会愈加深入。将来图像辨认技术将会愈加弱小,愈加智能地出如今我们的生活中,为人类社会的更多范畴带来严重的运用。在21世纪这个信息化的时代,我们无法想象分开了图像辨认技术当前我们的生活会变成什么样。图像辨认技术是人类如今以及将来生活必不可少的一项技术。




Fly-AI竞赛服务平台是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周收费提供项目开源算法样例,支持算法才能变现以及疾速的迭代算法模型。有兴味参与图像辨认、语音、自然言语处理的AI开发者,可以参与竞赛并且有奖金可以赚取。

https://www.flyai.com/d/OCRWords 3981个中文文字图像辨认

https://www.flyai.com/d/BirdClassification 200种鸟类图像分类

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

云的轨迹a 2020-8-19 16:41:11 显示全部楼层
鄙视楼下的顶帖没我快,哈哈
回复

使用道具 举报

yishanyish 2020-8-20 13:01:38 显示全部楼层
想知道楼主的感受,怎么样?
回复

使用道具 举报

难有一曲钟萦耳 2020-8-21 12:22:05 来自手机 显示全部楼层
大佬,这是大佬
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies