您现在正在浏览:首页 > 职教文章 > 职教论文 > 人工智能在模式识别方面的应用

人工智能在模式识别方面的应用

日期: 2012-3-11 21:45:21 浏览: 0 来源: 学海网收集整理 作者: 丁丽

摘 要: 随着信息技术的飞速发展,人工智能的应用越来越广泛,其中模式识别是人工智能应用的一个方面。文章介绍了人工智能在模式识别方面的应用。
   关键词: 人工智能; 模式识别; 汉字识别; 数字识别; 语音识别; 指纹模式识别; 三维人脸识别; 数字信号处理器
  
   1 引言
   计算机硬件的迅速发展,计算机应用领域的不断开拓,迫切地要求计算机能够更有效地感知诸如声音、文字、图像、温度、震动等人类赖以发展自身、改造环境所运用的信息资料。但就一般意义来说,目前一般计算机却无法直接感知它们键盘、鼠标等外部设备,对于这样五花八门的外部世界显得无能为力。纵然电视摄像机、图文扫描仪、话筒等设备业已解决了上述非电信号的转换,并与计算机联机,但由于识别技术不高,而未能使计算机真正知道采录后的究竟是什么信息。计算机对外部世界感知能力的低下,成为开拓计算机应用的瓶颈,也与其高超的运算能力形成强烈的对比。于是,着眼于拓宽计算机的应用领域,提高其感知外部信息能力的学科——模式识别,便得到迅速发展。
   人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式,是对人类感知外界功能的模拟, 研究的是计算机模式识别系统,也就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。现将人工智能在模式识别方面的一些具体和最新的应用列举如下。
   2 人工智能
   人工智能(Artificial Intelligence)是相对人的自然智能而言,即用人工的方法和技术,模仿、延伸和扩展人的智能,实现某些“机器思维”。作为一门学科,人工智能研究智能行为的计算模型,研制具有感知、推理、学习、联想、决策等思维活动的计算系统,解决需要人类专家才能处理的复杂问题。人工智能就其本质而言,是对人的思维的信息过程的模拟。
   3 模式识别
   模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。这里,我们把环境与客体统称为“模式”,随着计算机技术的发展,人类有可能研究复杂的信息处理过程。用计算机实现模式(文字、声音 、人物、物体等) 的自动识别,是开发智能机器的一个最关键的突破口,也为人类认识自身智能提供线索。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得) 的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别系统(Optical Character Recognition,OCR) 、语音识别系统等。
   所谓模式识别,可以理解为根据识别对象特征的观察值将其分到某个类别中的过程。利用计算机进行模式识别在2O世纪6O年代初迅速发展并成为一门新学。
   4 人工智能在模式识别方面的应用
   4.1 数字识别,汉字识别与语音识别
   手写体数字识别在邮政编码识别、银行业务等方面有重要应用,由于字体变化大,对识别率要求高,所以有较大困难。手写体数字识别使用的技术是人工智能中的神经网络技术,神经网络具有学习能力和快速并行实现的特点,可以用于解决这一问题 。
   相比而言,汉字的识别是更加困难的一件事。常用汉字共有6763个,分为两级,第一级3755 ,第二级包括3008个,在使用的过程中有时还可能会用到其他的外国的字符以及特殊的符号。每个字符都对应着一个类别。即开头有变化,发生畸变或受到干扰等影响的同一字属于一类,相对于只有l0 个的数字而言,汉字的数量因为大于6000,而且又有印刷体和手写体之分,因此,要用计算机进行精确的分类,其困难的程度也比数字识别大多了。所以,手写体汉字的识别是一个很困难的模式识别问题。解决的办法,同样需要神经网络技术的支持,而且还要从不同地区搜集大量的手写体汉字作为样本集对神经网络进行训练。其运算量也是惊人的。幸运的是,现在已经有了一些印刷体汉字识别软件,如清华紫光OCR软件,就可以识别扫描图片中的汉字,虽然准确率还不是100%,但是这说明在汉字识别方面毕竟已经取得了一些进展。中科院自动化研究所汉王公司开发成功的“汉王笔”是一套在一块手写板上书写。从而把汉字输入计算机的联机手写汉字识别系统。
   语音识别就是让计算机能听懂人说的话, 一个重要的例子就是七国语言(英、日、意、韩、法、德、中)口语自动翻译系统。其中,中文部分的实验平台设立在中国科学院自动化所的模式识别国家重点实验室,这是口语翻译研究跨人世界领先水平的标志。该系统实现后,人们出国预定旅馆、购买机票、在餐馆对话和兑换外币时,只要利用电话网络和国际互联网,就可用手机、电话等与“老”通话。
   4.2 基于模式识别的网络考试系统设计
   这是一种基于模式识别的网络考试系统,对整个软件的系统结构、功能以及实现的关键技术进行了探讨。该系统采用 SQL Server数据库和指纹模式识别技术,成功地实现了网上考试、培训和学习等。
   随着信息化的不断发展,人们需要不断地进行知识更新。由于流动单位如乘务员的工作性质较特殊,大规模的集中学习和考试无法满足正常的工作需要,而基于模式识别的网络考试系统即可达到这一目的。该系统的使用对基本技能和企业管理水平的提高有较大的实用价值。
   本系统主要应用于企业内多媒体教室中,主要由一台服务器(PIV,内存512MB) ,多台PC(PII—I533,内存28MB)和两个指纹识别仪,其网络布局总体上是采用树型拓扑结构。本系统采用c++Builder5.0作为开发工具,服务器配置为Windows NT操作系统、SQL Server数据库;教师管理计算机配置为Windows 2000操作系统;考生考试终端配置为Windows 98/2000操作系统 。
   整个考试系统软件可分为四个部分:指纹校验、试卷管理、考生考试和考试记录。
   其中的指纹校验作为考试系统的关键技术之一,采用的即是人工智能的模式识别。指纹模式识别技术及应用实现如下。
   目前的指纹识别系统总体来看分为两大类:验证和辨识。验证就是通过把一个现场采集到的指纹与一个已经登记的指纹进行一对一的比对来确认身份的过程。为验证的前提条件,他的指纹必须在指纹库中已经注册。指纹以一定的压缩格式存储,并与其姓名或其标识(ID,PIN)联系起来。在比对现场,先验证其标识,然后利用系统的指纹与现场采集的指纹比对来证明其标识是合法的。辨识则是把现场采集到的指纹同指纹验证和辨识在比对算法和系统设计上各具技术特点。本系统在数据库管理、教师控制PC和考生登录上应用了指纹验证和指纹辨识技术。计算机处理指纹时只涉及到指纹的一些有限信息,而且比对算法并不是精确匹配,其结果也不能保证l00%准确。尽管指纹识别系统存在着可靠性问题,但其安全性比相同可靠性级别的“用户ID+密码” 方案的安全性高得多。例如,采用四位数字密码的系统不安全概率为0.01%,如果同采用误判率为0.01%指纹识别系统相比,由于不诚实的人可以在一段时间内试用所有可能的密码,因此四位密码并不安全,但他绝对不可能找到一千个人去为他把所有的手指( 十个手指) 都试遍。考虑到指纹识别仪发生故障等原因,本系统在各种权限登录上设置了“用户ID+密” 的方式。
   4.3 人脸立体模式识别
   人脸识别的过程分为3个主要部分:人脸模式库,即判断所采集图像中是否存在人脸,若有给出每个人脸的位置、大小;面部特征定位,即对每个人脸检测其主要器官的位置和形状信息,并将其归一化处理;比对,即根据面部特征定位的结果,与图像库中人脸对比,判断该人脸的身份信息。主流的人脸识别技术基本上可以归结为3类:基于几何特征的方法,基于模板的方法和基于模型的方法。基于几何特征的方法是最典型的方法,通常需要和其他算法结合才能有比较好的效果;基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。基于模型的方法则有基于隐马尔可夫模型、主动形状模型和主动外观模型的方法等。
   基于人脸特征进行身份验证,易用性好,精确度高,用户容易接受,稳定性好,相比其它人体生物特征,它具有直接、友好、方便的特点。表情、光照和一定范围内的姿态变化是目前人脸识别技术中影响识别精确度的主要因素。人脸识别的二维图像技术已经有很多不同的方法,但基于三维立体图像的人脸识别技术却较少报道。人脸二维和三维模型获取不同的脸部外貌特征,二维图像中的灰度值表示了人脸表面亮度差异,而三维图像中加入的深度信息是表示脸形的数据,信息量更为丰富, 更有利于提高识别效率。
   所谓数字信号处理器(Distal Signals Process,DSP)嵌入式系统,实际上就是把DSP系统嵌入到应用电子系统中,软件、硬件可裁剪,满足应用系统对功能、靠性、成本、体积、功耗等严格要求的专用计算机系统,它是一种典型的软硬件混合系统,自底向上可以分为硬件环境、嵌入式操作系统和应用程序3个部分。DSP如模拟器件(ADI)公司的ADSP 系列和德州仪器(TI)公司的TMS系列的立体人脸图像识别便携系统高速准确,实时性好,价格低廉,可实用化程度高。
   图1中给出了一种基于DSP的人脸识别系统设计方案。图中驱动器和定时产生器产生双目CCD器件f或CMOS器件)的时钟信号。相关双采样和自动增益提高图像质量,在DSP中完成图像归一化处理、小波去噪和图像压缩。SDRAM用于数据暂存。用户可通过液晶显示器上看到即时的图像,视频输出用于监测。RS一232用来连接Pc。系统工作时用户用键盘输入ID号,调出Flash中人脸数据库中相应的库图像和实时采集的图像进行识别比较。
   TI公司的TMS320C6701 DSP具有片内存储器,不需要外部高速存储器,所有图像流水线操作都能在片上执行,在低功耗情况下能提供商眭能,处理速度非常快, 非常适合于立体人脸实时识别系统。根据图像数据库的大小,可以扩展Flash,或者通过RS一232访问Pc中的数据库。用户还可以根据具体人脸模式识别要求选择其他更合适的DSP。
   Code Composer Studio(CCS)是TI公司推出的一个集成性DSPs软件开发工具。在CCS环境下,开发者可以对软件进行编辑、编译、调试 、代码性能测试和项目管理等所有工作,从而完成DSP嵌入式立体人脸识别系统的设计与调试。
   5 结束语
   以上简单介绍了人工智能在模式识别中的几种应用。模式识别是一个不断发展的新学科,它的理论基础和研究范围也在不断发展, 随着应用范围的不断扩大以及计算机科学的不断进步,基于人工神经网络的模式识别技术在今后将会得到更大的发展,量子计算技术也将用于模式识别研究。
   【参考文献】
   [1] 蔡自兴,徐光祜编著.人工智能及其应用[M].北京:清华大学出版社,2005.
   [2] 周廷美,刘方明,莫易敏.基于模式识别的网络考试系统设计Ⅲ.计算机工程与科学,2005,27.(7).
   [3] 熊和金,朱家禄.人脸立体模式识别[U].计算机工程,2005,31.(8).
   [4] ADistributed Artificial Network SoNing Complex and M—tiple Causal Associations.Apphed Intelligence 19,189—207,2003.2003 KluwerAc ademic Pubhshers.Manufactured in The Netherlands.

返回顶部