绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇数字图像处理综述范文,希望它们能为您的写作提供参考和启发。
【中图分类号】G642 【文献标识码】A 【文章编号】1006-9682(2012)10-0001-03
一、引 言
数字图像处理作为一门学科大约形成于20世纪60年代初期,并首次在航空航天领域取得了成功应用。数字图像处理技术的发展除了与计算机技术、信息技术的快速发展密切相关以外,还得益于其在航空航天、工业、生物医学、军事、通信工程、商务、环境、林业等诸多领域的广泛应用,正是这些应用需求,促进了数字图像处理技术的深入研究和快速发展。“数字图像处理”课程是随着计算机和信息技术发展应运而生的一门新兴课程,已成为信息类专业本科生的重要专业课。通过该课程的学习,要求学生掌握数字图像处理的基本概念和原理,能够对图像进行各种处理,如图像增强、图像运算、图像编码、边缘检测等,为图像通信、模式识别、计算机视觉以及其他交叉学科等工程领域的应用奠定基础。
“数字图像处理”课程的理论教学很抽象,仅仅通过理论教学学生很难掌握数字图像处理的基本原理。如果把数字图像处理的广泛应用引入课堂理论教学,将具体知识点与其在实践中的使用相结合,同时为学生提供边学边实践的机会,不仅可以提高学生的学习兴趣,加深对抽象理论知识的理解,增强其动手实践的能力,还可以拓展学生的视野,与目前学科前沿技术相衔接。
二、视觉测量技术
在现代三维测量新技术中,视觉测量是由计算机视觉、图像处理、模式识别等多学科交叉结合而形成的科学。图1所示,视觉测量是一种非接触性测量手段,以数字图像作为信息载体,对被测目标进行成像,通过提取多个像面的二维像点信息,标定相机内、外参数,并重建、优化被测目标的三维信息,实现测量。视觉测量基于严谨的理论和现代的硬软件设施,可以达到相当高的精度和可靠性,便于对大型工件、设备的尺寸、位置、三维轮廓等进行高精度测量,而且移动方便,可快速灵活地构建适于不同测量对象的系统,进行现场测量。目前,视觉测量技术已经广泛应用于建筑工程、航空航天、汽车制造、生物医学、考古等各个领域。[1~5]因此,视觉测量技术正在深入工业生产和社会生活的各个领域,研究和应用新的基于光学、数字图像和视觉信息融合的三维测量方法,既具有重要的理论意义,又具有重大的实用价值,应用前景非常广阔。
根据视觉测量的基本原理,利用数字图像处理技术获取的二维信息是视觉测量中相机标定、三维重建等环节的基础,对于系统的测量精度、稳定性等方面具有决定性的影响,是视觉测量领域的关键技术。在长期的数字图像处理课程教学以及视觉测量研究工作中发现,可以将视觉测量中关于数字图像处理的应用内容引入课堂教学中,与具体理论知识相结合,加深学生对于课程理论的理解,使其接触到科学研究的前沿内容。此外,通过设置开放性实验等环节,引导有兴趣和能力的学生进行实践能力的培养,使学到的知识“活”起来。
三、视觉测量与数字图像处理课程的融合
为了改善数字图像处理课程的教学效果,提高教学效率,将视觉测量技术与数字图像处理课程相融合,本文主要在教学方法和教学手段改革、视觉测量需求与理论知识点结合、实践动手能力提高等方面进行了研究。
1.教学方法和教学手段改革
为了贯彻学生是教育主体的教育思路,使学生学会学习,并充分激发学生的创新能力和素质培养,促进学生个性的发展,同时有利于师生彼此促进共同进步的原则,针对数字图像处理课程的特点,采取了以下措施:
(1)重视数字图像处理课程的基础理论教学。数字图像处理内容丰富,应用灵活广泛,但学生在掌握某些具体应用技术时感到理解困难。因此,在实际教学上,首先需要注重相关的基础理论教学。[6]例如,数字图像的本质是数字信号,所以在课程前期阶段,专门有针对性地复习和讲解了信号分析与处理方面的基本理论,包括数字信号处理的常用方法、离散傅里叶变换和快速傅里叶变换、离散余弦变换等,这些理论在数字图像处理课程中有具体应用。这不仅有利于对数字图像处理内容的掌握,也可以反过来加深对相关理论的理解。另一方面注意授课内容的精选,内容不在于多,而在于少而精,突出重点,使学生在有限学时内有最大的收获。例如,在频域空间进行图像增强时,不能将频域空间的所有方法都对学生讲授,而是突出讲解了关于频域空间与时域空间处理之间的关系,针对频域图像平滑介绍一种低频滤波器,分析其原理和特点。这样不仅节省了教学时间,而且重点突出,同时也引导学生查阅其他相关方法,让他们自己去动脑思考,提高其思维能力。
(2)完善和改革课堂教学方法。在课堂教学过程中,我们始终重视启发式教学,遵循“提出问题”、“启发式思考”、“解决问题”的教学过程,使用“问题教学法”引导学生去思考、分析问题,激发学生学习的积极性,提高教学效果。课堂开始时,根据授课内容,提前向学生抛出相关问题,在讲课过程中则围绕该问题讲解课程内容,最后提出问题的解决方法。例如,在讲解“直方图均衡化图像增强技术”一节内容时,首先向学生展示了两幅曝光不足和曝光过量的图片,并且为了提高学生的学习兴趣,认识数字图像处理的实际应用,图片取自于视觉测量、航空交会对接定位等领域的实际图片,向学生提问,“如果实际应用中,由于环境光的影响,拍摄到了这样的图片,应该怎么办?”课堂讲解过程中,随着直方图、直方图增强技术的理论、直方图均衡化方法等内容的展开,使学生逐渐理解并掌握直方图均衡化方法,最后,给学生演示了直方图均衡化方法的实现,并看到了利用该方法对图片增强前后的图片效果。这种启发引导式的课堂教学方法,取得了良好的效果。
(3)传统和现代化教学手段相结合。随着计算机、通信技术应用的迅速普及,国内高校的课堂教学已普遍采用了多媒体技术,利用计算机、投影仪、幻灯机等现代化教学设备,结合计算机辅助教学(CAI)展示教学内容。这些现代化技术的确为课堂带来了很多丰富多彩的教学手段。数字图像处理是以图像为处理对象,其输出的形式主要以图像和图形为主,该课程也十分适宜将教学内容制成课件,采用多媒体计算机开展现代化教学。借助多媒体,使学生较直观地看到各种图像的处理需求、处理过程、处理效果等,这是普通教材和参考资料所无法比拟的。因此,我们针对课堂教学需求,进行了多媒体课程教学资源建设,如教学大纲、教学日历、授课教案和课件等通过多媒体平成,便于讲课,同时也便于学生课后的复习。例如,将视觉测量原理、过程等,通过多媒体课件的形式演示出来,相比较口头介绍等方法具有更加直观的效果。除了多媒体教学手段,传统的板书式教学作为补充手段也在数字图像处理课程中得到应用,主要用在课堂教学内容框架展示、理论推导等方面。
2.视觉测量与理论知识点结合
为了提高算法对于目标特征的识别效果,视觉测量通常采用圆形或方形特征点(图2),在获取的图像中对特征的成像位置进行识别和精确定位。视觉测量对于图像处理的要求主要包括图像预处理、特征粗定位、特征精定位等内容,对应数字图像处理课程中的图像增强、边缘检测、特征识别、几何运算等知识点。[7]
图2 视觉测量常用特征点
(1)图像预处理。图像预处理的主要方法包括彩色图像灰度化、图像增强等,为此,在讲解彩色图像内容时,介绍了RGB、HSI等彩色模型以及不同彩色模型之间的转换,并引出如何将彩色信息转换成灰度信息。通过分析彩色表示模型,建立了彩色到灰度图像的转换。
向学生展示常用视觉测量图像效果的基础上,为了减少图像噪声的影响、提高图像识别效果,提出改善图像质量的目标,需要进行图像增强。结合图像增强中常用的直方图增强技术、空域和频域图像增强方法在视觉测量图像处理中的实际应用,给学生展示直观的处理效果,加深对图像增强方法的理解。
(2)特征点粗定位。数字图像处理的边缘检测是该课程比较重要的一部分内容,边缘检测中包含了多种方法,便于学生对不同边缘检测算法的作用效果有直观印象,将各种算法应用于视觉测量图像征点的边缘检测,并有针对性地选择相应参数,使学生不仅学习了各种边缘检测算法的使用,也看到了算法的特点。
根据视觉成像的特点,圆形特征点成像后一般为椭圆,所以,利用边缘检测得到的边缘像点数据,讲解用边缘点进行指定特征识别的方法,如基于Hough变换的特征检测方法。为了引导学生思考,采用启发式讲课方法,讲解了Hough变换检测直线的方法,引出如何用Hough变换检测像面上的圆或椭圆,并鼓励有能力的学生实现相应算法。
(3)特征点精定位。特征点精定位的目的是在实现特征点粗定位的基础上,对圆形特征点中心在像面上的精确坐标进行定位。精确定位主要设计到数字图像处理中的点运算,但需要考虑采用的具体定位算法,如灰度重心法、加权灰度重心法、椭圆拟合法等。引导学生通过文献资料查找和实现相关定位算法,并且与国际领先的专业软件进行定位精度对比。通过比较,可以使学生发现不同算法之间的区别,并分析不同的原因。进一步,引导学生尝试对定位算法做一定的改进,这种改进,不需要从算法根本上做出很大的创新,只是从某一方面进行微小的变化,使其能够适合特定的应用需求。例如,如果对视觉测量像面上特征点定位采用加权灰度重心法时,通过调整加权系数,得到不用的效果,从而分析加权系数对于定位精度的影响,并据此得出适用于该需求的结论。
四、开放性实验
长期以来,“数字图像处理”课程教学主要采用课堂理论教学,教学内容也多为经典的内容,很难反映课程内容的时代特征。实验教学是高等教育的重要组成部分,是抽象思维与形象思维、传授知识与训练技能相结合的过程,在人才培养中具有课堂理论教学环节不可替代的作用,对培养理工科大学生的创造性是不可缺少的。虽然目前大多数课程都设置了实践环节,但也普遍存在着很多问题,[8]例如,实验课成绩占课程成绩比例小,学生对实验的重视度不够,存在着抄袭他人实验结果和报告的现象;实验模式单一,实验内容陈旧、呆板,多为验证性实验,缺乏创新性和挑战性,学生完全处于被动状态,最终导致实验不认真,敷衍了事,所学的知识和操作技术遗忘快;不能保证每个学生都有充分的时间和机会做实验,个别学生逐渐养成依赖心理,最终只有一部分学生得到了锻炼;理论课与实验课教学老师分离,造成理论和实践环节脱节等。
针对目前“数字图像处理”课程实验的现状,根据视觉测量像面特征点定位需求,开设相关开放性实验项目“视觉测量特征点提取定位实验”,实验要求学生结合数字图像处理课程知识理论,对视觉测量采集的数字图像进行处理,提取相关特征点。针对视觉测量中常用的特征点(圆形、方形)进行自动检测,并实现高精度定位,主要实验内容包括:图像预处理、特征点粗定位、特征点精定位、算法设计与实现、实验结果分析等。
教师在开放性实验项目中承担的角色主要是方案设计和实施过程中的指导、监督,对方案的具体实现方法不做限制性要求,主要由学生结合课堂教学内容以及查阅文献资料来设计并完成。为了提高项目完成的效率,教师可以通过适当的引导为学生指出主要方向。
对于单个学生来说,这样的实验项目有些困难,“团队合作”也是新时期对科技人才素质的要求,所以可以通过建立项目小组的方式开展实验。小组成员将实验内容进行分工,每人负责不同的部分,通过相互合作、帮助,完成整个实验项目。通过这种形式,也在某种程度上锻炼了学生的团队合作意识和合作方法。
五、结束语
通过将视觉测量领域研究成果引入“数字图像处理”课程,并在教学方法、教学手段、教学内容、开放性实践等方面的改革和尝试,逐步做到科学研究成果与课堂理论教学的有机结合,不仅丰富了课程的教学内容,提高了学生的学习兴趣,加深了对理论知识的理解,而且使学生接触到科学研究的前沿领域,开拓了视野,对创新能力的培养锻炼等方面也具有重要意义。
参考文献
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季铮、盛庆红.基于近景数字视觉测量的飞机表面模型重建[J].地理空间信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 刘常杰、邾继贵、叶声华.汽车白车身机器视觉检测系统[J].汽车工程,2000(6):373~376
5 彭三城、孙星明、刘国华.三维人体自动测量技术综述[J].计算机应用研究,2005(4):1~5
【中图分类号】TP391.41【文献标识码】A【文章编号】1672-5158(2013)02-0129-02
1.数字图像处理技术的内容及特点
1.1 研究内容
不管应用到哪个领域的图像处理图像数据都要输入、加工和输出图像,其研究内容:
(1)获取、表示和表现图像――把图像信号转化为计算机可以识别的形式,并把数字图像显示和表现出来。
(2)图像复原――已知图像发生退化的缘由时,对图像进行修复,关键是建立退化模型。复原是以模型和数据的图像恢复为基础,消除退化的影响。
(3)图像增强――对图像质量的常规改善。当不知道图像退化原因时,还可用此技术比较主观的改善图像。
(4)图像分割――人类视觉系统可以轻松地将观察到的对象区分开来,但计算机却很难。分割的基本问题目前是将各种方法融合使用,以此提高处理的质量。
(5)图像分析――检测和测量图像中的目标,获取其客观信息,是从图像到数据的过程。
(6)图像重建――指从数据到图像的处理。
(7)图像压缩编码――为减少数据容量、降低数据率、压缩信息量,在不影响其效果的前提下减少图像的数据量。
1.2 数字图像处理技术的特点
(1)图像再现性好――不会因为对图像的变换操作而影响到图像质量;
(2)图像处理精度高――可以将图像数字处理为任意大小的数组;
(3)适用面宽――来自不同信息源的图像被变换为数字编码形式后,都可以用数组来体现灰度图像。
(4)灵活性高――图像处理可完成线性及非线性处理。
2.应用领域
数字图像处理技术被应用到越来越多的领域中,如医疗保健、航空航天、交通通信、军事、工业、农业、林业等。下面选取几方面进行分析:
(1)试听资料证据――视听资料证据是重要的诉讼证据,在司法诉讼活动中发挥着越来越重要的作用,数字图像处理技术是视听资料证据中图像证据资料技术性司法鉴定的常用手段,是图片原始性、真伪性、相关性认定的基本方法,如名捕监控录像模糊图像处理系统,该系统是手印、足迹、枪弹痕迹、工具痕迹、印章检验、文件检验以及录像带处理等痕检、文检、视频图像处理工作的必备工具;以及实时视频降噪仪,能够实时处理现场录像流,增强视频的清晰度,该在录像安全系统中加强监视录像的清晰度,或者在警方实地调查拍摄录像后回到警署再进行降噪。
(2)电子商务――当前的电子商务中,图像处理技术也大有可为,如身份认证、产品防伪和水印技术等。
(3)军事公安领域――军事的目标是侦察、制导和警戒系统和自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、印章和人像等的处理和辨识;历史文字和图片档案的修复和管理等。而数字图像处理技术将数码摄影和图像处理技术结合起来以其独特的优势在公安领域中逐步开始担当重任,在刑事摄影、档案管理、痕迹检验、文件检验、法医、物证提取以及公安教学或宣传中发挥着巨大作用,为广大的公安人员开阔了视野、拓展了思维空间,为执法的公正性提供了有力保证,应用提高了工作效率,减少了人、财、物的消耗,大大提高了工作效率。
(4)智能交通――图像处理具有算法柔性大、适应能力强等特点,在智能交通系统中取得了广泛的应用价值,例如车牌识别(车牌定位、车牌倾抖校正与字符分割、车牌字符识别变换等)和车辆检测与跟踪系统(包括感兴趣区域提取、车辆检测、车辆跟踪等),智能车辆导航、车型识别、交通控制等。
(5)航空航天通信――包括图像传输、电视电话和视会议等,主要是进行图像压缩甚至理解基础上的压缩。
(6)遥感技术――航空航天和卫星摇撼图像获取中和获取后都要用图像处理技术进行加工处理,提取出有利用价值的信息。主要用来对地形地质、矿藏资源搜索以及农业、水利、森林和海洋等资源调查研究,对自然灾害进行预测预报、检测环境污染、处理气象卫星云图以及识别地面军事目标。
(7)生物医学领域――图像处理在医学界的应用非常广泛,图像处理首先应用于细胞分类、染色体分类和放射图像等,临床诊断和病理研究中都大量接住了图像处理技术。它的直观、安全方便、无创伤的优点受到医生和患者的青睐。
(8)工业生产中的应用――在生产线中对产品及部件进行无损检测
(9)机器人视觉――机器视觉相当于智能机器人的重要感觉器官,可以对三维景物进行理解,医院、工厂、邮政以及家庭中的智能机器人,识别和定位装配线工件,太空机器人的自动操作。
(10)视频及多媒体系统――目前,电视制作系统中广泛使用图像处理、变换和合成技术,使电视效果更佳。在多煤体系统中广泛使用静止图像和动态图像的采集、处理、存储、传输和压缩,以达到使用者的目的。
(11)科学可视化――图像处理和计算机图形学的紧密结合,使科学研究得各个领域有了更为新颖的研究工具。
(12)宇宙探测――由于探索太空的需要和太空技术的快速发展,需要用数字处理技术来处理从外太空获取的大量星体照片。
(13)地质勘探――近年来发展起来的以数字图像处理技术为基础、综合多门学科知识的地学信息处理新技术的多源地学信息综合图像处理,使用一些特定的图像处理方法,实现了多源地学信息综合图像处理,用来辅助地质填图,构造地质研究,进行寸产资源的预测和评估,成为当前地质工作者正在研究和探讨的一个问题。
由图像处理技术在以上几个领域中的应用可以看出,图像处理技术在各领域中的重要程度:计算机图像生成技术在航空航海中可以充当仿真训练系统,还可以应用到广告和动画制作,跟友人将其应用到网游中;图像传输与通信还可在多媒体教学、网络视频领域得到广泛应用;在医学上,医学图像处理和材料分析也日益重要,如超声成像、X光成像、Y光成像以及核磁共振成像,对医生工作产生了巨大的辅助;图像跟踪和光学制导在战略技术武器中发挥了重要作用。
3.发展方向
随着计算机的发展,图像处理技术将越来越成熟,对各领域的影响也越来越大,总的来说,图像处理技术的发展有以下几个趋势:
(1) 在目前的基础上,图像处理速度越来越快,分辨率越来越高,多媒体应用光来月广泛,标准化、立体化程度越来越高,并产生智能化的趋势;
(2) 在目前二维基础上将出现多维成像的趋势;
(3) 芯片广泛运用到图像处理技术中,使用起来更加方便;
(4) 将出现新的算法与理论。
图像处理技术在各个领域的应用与发展,大大降低了相应领域的工作难度,效率更高,质量也无可挑剔,使人类受益匪浅。日后图像处理技术将进一步根据人类需求,在相关科研人员的努力奋斗下而实现新的突破,在更为广阔的领域造福人类事业。
参考文献
[1] 李红俊,韩冀皖.数字图像处理技术及其应用. 计算机测量与控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]杨枝灵,王开.Visual C++数字图像获取、处理及实践应用.人民邮电出版社,2003
中图分类号:TP312 文献标识码:A
1 数字图像技术概述
数字图像处理工具箱函数包括以下15类:(1)图像显示函数;(2)图像文件输入、输出函数;(3)图像几何操作函数;(4)图像像素值及统计函数;(5)图像分析函数;(6)图像增强函数;(7)线性滤波函数;(8)二维线性滤波器设计函数;(9)图像变换函数;(10)图像邻域及块操作函数;(11)二值图像操作函数;(12)基于区域的图像处理函数;(13)颜色图操作函数;(14)颜色空间转换函数;(15)图像类型和类型转换函数。
MATLAB图像处理工具箱支持四种图像类型,分别为真彩色图像、索引色图像、灰度图像、二值图像,由于有的函数对图像类型有限制,这四种类型可以用工具箱的类型转换函数相互转换。MATLAB可操作的图像文件包括JPG、HDF、JPEG、PCX、TIFF、XWD等格式。下面就图像处理的基本过程讨论工具箱所实现的常用功能。
图像的读写与显示操作:用imread( )读取图像,imwrite( )输出图像,把图像显示于屏幕有imshow( ),image( )等函数。imcrop()对图像进行裁剪,图像的插值缩放可用imresize( )函数实现,旋转用imrotate( )实现。
图像增强是数字图像处理过程中常用的一种方法,目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。
2 MATLAB图像处理工具箱运用实例
为了证明MATLAB语言是一种简洁,可读性较强的高效率编程软件,本文通过运用图像处理工具箱中的有关函数对一实拍的芯片图像进行处理。如图1,图“Fig.jpg”为一幅原图像,该图像右边的剪切图像为从“Fig.jpg”中剪切出的将用于分析的子图像块。为了便于分析与观察,把子图像块旋转90度置于水平位置并把该图存在名为“Fig1.jpg”的图像文件中。以上的过程可用以下代码实现。
x=imread('E:\study\电子与通信\Term 2\数字图像处理DIP\Fig.jpg');
figure,imshow(x);
y=imcrop(x);
figure,imshow(y,[]);
z=imrotate(y,90);
imwrite(z,'E:\study\电子与通信\Term 2\数字图像处理DIP\Fig1.jpg','jpg');
isrgb(z)
原图Fig.jpg 剪贴图Fig1.jpg
图1
经判断得知该图像为一真彩色图像,首先把它转换为灰度图像,以下所有的进一步处理均采用经过灰度化处理后的图像作为原图。
通过比较灰度原图和经均衡化后的图形可见图像变得清晰,均衡化后的直方图形状比原直方图的形状更理想。效果比较见图2,程序代码如下:
x=imread('E:\study\电子与通信\Term 2\数字图像处理DIP\Fig1.jpg');
y=rgb2gray(x);
subplot(221),imshow(y);title('Fig1.jpg 灰度化图像');
subplot(222),imhist(y);title('均衡化前直方图');
I=histeq(y);
subplot(223),imshow(I);title('均衡化后图像');
subplot(224),imhist(I);title('均衡化后直方图');
图2
3 结论
以上图像处理实例只是对MATLAB图像工具箱的一小部分进行运用,经过更进一步的图像分割、二值化、归一化等处理,可以把芯片中的字符特征提取出来送入神经网络分类器进行识别,我们应用MATLAB神经网络工具箱对字符分类进行模拟仿真也取得了较好的效果。由此可以看出MATLAB语言简洁,可读性强,工具箱涉及的专业领域广泛且功能强大。图像工具箱几乎包括所有经典的图像处理方法。由于工具箱具有可靠性和开放性,我们可以方便地直接加以使用,也可以把自己的代码加到工具箱中以改进函数功能,同时,MATLAB中的小波工具箱也有许多函数可运用于图像处理技术。因此,在图像处理技术中使用MATLAB语言可以快速实现模拟仿真,大大提高实验效率, 如果要开发实用程序,MATLAB语言还可以通过MEX动态连接库实现与C语言的混合编程,为工程应用提供了更多的便利条件。
参考文献
摘要:为了预防矿井下电机车撞人事故的发生,提出了一种基于数字图像处理技术的轨道行人识别算法,首先对图像进行尺度变换,裁剪,中值滤波,维纳滤波,垂直边缘检测,二值化,密度模板匹配,阈值分割,连通域筛选和轨道拟合,识别出轨道,然后用行人和非行人样本对支持向量机的参数进行训练,最后运用支持向量机对轨道上的行人进行识别。运用该算法,对现场采集到的图片进行Matlab仿真实验,实验结果表明该算法能很好的识别出轨道上的行人,做到提前报警。
关键词 :电机车;数字图像处理;轨道检测;行人识别;报警
中图分类号:TD7文献标志码:A文章编号:1000-8772(2014)19-0202-01
1 引言
矿用电机车多年来一直作为矿井下的主要运输设备,由于矿井下情况复杂,机车运行频繁,可能会发生电机车撞人事故,因此急需要一种监测报警系统,对行人进行识别报警。
目前运用在车辆上的检测障碍物方法主要有:超声波检测、毫米波雷达检测、红外线检测、激光检测和摄像头检测等,在运动的电机车上,摄像头检测更具优势,摄像头检测即图像识别[1,2]。行人检测被广泛用于行人流量统计、智能车辆辅助驾驶、智能交通、防盗报警,行人报警等方面,具有广大的应用前景[3]。行人检测即从图像或视频中识别出行人,主要有两步:特征提取和分类定位,行人的特征包括HOG特征,纹理特征,SIFT特征等;行人检测的方法有:基于运动的方法、基于形状的方法、基于模板匹配的方法和基于统计分类的方法等[3,4]。
将现有的行人识别算法用于矿井下轨道上的行人识别,具有丰富的理论依据和广大的应用前景,可降低矿下机车撞人事故的发生。本文行人检测的思想是:先识别轨道,再识别轨道上的行人。
2 MATLAB仿真
设原图像的尺寸为:M×N M,N都为偶数,则下采样后图像的尺寸为:M/2×N/2。在下采样后图像中裁剪的区域为x坐标:x1x2,y坐标:y1y2。中值滤波的尺寸为3×3,维纳滤波的尺寸为5×5,垂直边缘检测算子为:。 密度匹配模板尺寸为3×3。垂直边缘检测出的图像和密度图像的二值化阈值都采用Otsu方法求得。检测窗口的大小为,块的大小为64×128,块的重叠率为,一个块内的单元数为4,单元的大小为8×8,在[-π/2,π/2]将梯度方向均匀的划分成9个区间[5-9]。图1中白色矩形区域为经支持向量机识别出的行人。
3、结论
一种基于数字图像处理技术的轨道行人识别算法能识别出轨道和行人,做到提前报警,本文仅从算法上实现,还需结合硬件,才能将该算法用到实处,在现实环境中,该算法的性能也有待检验。该行人识别算法可进一步推广,用到现实中各种场合的行人识别。
参考文献:
[1] 王荣本,赵一兵,李琳辉等.智能车辆的障碍物检测研究方法综述[J].公路交通科技,2007,11:109-113+124.
[2] 贾慧星,章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J].自动化学报,2007,01:84-90.
[3] 王兴宝.复杂场景下多姿态行人检测与识别方法研究[D].苏州大学,2012.
[4] 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东.行人检测技术综述[J].电子学报,2012,04:814-820.
[5] 范昕炜.支持向量机算法的研究及其应用[D].浙江大学,2003.
[6] 方莉,张萍.经典图像去噪算法研究综述[J].工业控制计算机,2010,11:73-74
[7] 陈刚.基于多特征的行人检测方法研究[D].吉林大学,2012.
中图分类号:TP3 文献标识码:A 文章编号:1007-9416(2014)02-0120-02
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
据公安部相关数据统计,现如今我国汽车保有量已达2.4亿辆,且每年的增长率都在15%以上,应用智能交通系统来解决随之产生的交通问题已是大势所趋。基于DSP的车牌识别方法是智能化车牌识别的有效方法。现如今,自动车牌识别技术已被广泛应用,但由于算法的复杂性与效率的矛盾,及算法于系统上的应用的困难性,对车牌识别的关键算法还有待于更深入的研究。
2 硬件系统结构
通用可编程的DSP芯片的硬件技术的发展给数字图像处理带来了飞跃性的进步。要实现车牌识别,需要数字图像处理技术中的很多复杂的算法,基于DSP的车牌识别系统也因此得到了广泛的研究与应用。为了提高整个系统的可操作性及性价比,当前应用最多的是分布式的处理模式,即联合PC机与DSP的优势共同完成车牌识别系统,其总体结构及具体结构如(图1)所示:
3 车牌识别关键算法
算法流程为图像预处理、车牌定位、车牌分割,最后字符识别。图像预处理为提高摄像机摄取的图像质量,便于后续处理。利用DSP技术在处理车牌识别关键算法中的车牌的定位与字符分割方面优势显著。
3.1 车牌定位
基于灰度图像的定位技术日趋成熟,但彩色图像包含了图像的更多信息特征,加之车牌的底色是有规律可循的,所以基于彩色图像的定位技术越来越成为在发展定位技术上的突破点。本文定位的思路为:
(1)图像从RGB空间转换到HSI空间,其算法为(以蓝底白色车牌为例):
(3)对二值图像进行水平投影[1],从车牌固有的矩形特征中的高度特征提取车牌图像,如图3所示。再使用特征颜色边缘检测法,检测车牌正确位置,如图4所示。
(4)根据车牌固有的矩形特征中的宽度特征,使用垂直投影法提取车牌图像,如(图5)所示:
3.2 字符分割
字符分割是字符识别的关键前提。在2013年新交通法规中规定,对故意遮挡、污损、不安规定安装车牌的扣12分的处罚,这项规定的出台,也间接降低了算法的复杂性。本文采用车牌字符间隔的特征在垂直投影中的规律来进行字符分割。
其算法原理为:
(1)设垂直投影值为T,阈值为V,在确定前还要充分考虑字符粘连、断裂及“1”字符的特殊性。当时,T=0。
(2)设数组为从左向右扫描的投影值,当扫描的数组的值时,字符的宽度设为。根据规律[2],单个字符的宽度约为45mm,除第2、3字符的间隔为34mm,其它字符的间隔均为12mm。由此,得出以下3中情况:
(1)时,为字符粘连,取为单个字符的宽度;
(2)且后面的字符也如此时,为字符断裂,合并这两个字符;
(3)且不满足字符断裂,此字符为数字“1”。
实验结果如(图6)所示:
4 结语
本文在以DSP处理器TMS320DM6437嵌入式系统上对以上两大关键算法进行实验研究,在150张不同类型的车牌进行识别后,测试结果的正确率92.3%,且处理的速度达到实时处理的需求。为以后在智能交通控制系统中的车牌识别技术的提高和发展提供了参考基础。
参考文献
中图分类号:TP212 文献标识码:A 文章编号:1007-3973(2012)011-059-02
1 引言
电网GIS平台是提供电网图形和分析服务的企业级电网空间信息服务平台,该平台建设主要工作就是基础地理数据及电力设施坐标数据采集。在将原始影像信息如矢量地图、航空航天影像、数字高程模型、导航数据等应用在GIS平台用于分析、决策、管理之前,对原始数据的处理展现必不可少。
对图像进行一系列的操作,以达到预期的目的的技术称作图像处理技术。公共设施、发电、输电、变电、配电等方面都对数据有不同精度的采集要求,在像源一定的情况下,对已采集到的数据使用图像处理技术进行二次加工,以满足不同程度的应用需求也是目前亟待研究的课题之一。
2 图像处理基本技术
数字图像处理的研究源于两个领域:其一是为了便于人们分析图像信息进行改进;其二是为使机器自动理解而对图像数据进行存储、传输及显示。
由于电网GIS影响多来源于卫星影像,而卫星传感器系统所采集的图像受到所在平台、太阳位置及角度、外界天气条件、飞行器位置姿态等等条件的制约和影响,会表现出一定程度的模糊、失真、扭曲变形、斑点噪声等等现象,在一定程度上降低了图像的质量,这就使得这些原始图像数据并不能直接被用于电网分析、决策,图像处理技术的应用必不可少。
2.1 图像几何校正
遥感图像几何校正是针对图像几何畸变而展开的误差校正。遥感图像的几何畸变表现为像元相对于地面目标实际位置发生挤压、扭曲、变形等。其基本环节有两个,即像素坐标变换和重采样。一般步骤如图1所示。
2.2 图像重采样
图像重采样的目的主要是保证图像像素的连续性,因为对遥感图像空间分辨率进行提升时,需要利用插值的手段在空出的像素上补上对应的值,使整个图像平滑,有利于进一步处理。其最基本方法有三种:最近邻插值、双线性插值和双三次插值。
2.3 图像增强
图像增强就是采用一定的方法对图像的某些特征进行调整,以突出图像中的某些感兴趣信息,同时抑制或去除不需要的信息来提高图像质量。它的主要目的是改变图像的灰度等级,提高对比度;消除边缘噪声,平滑图像;突出边缘及图像主要信息,锐化图像、压缩数据量等。
图像增强主要方法根据处理空间的不同,分为空间域方法和频率域方法两大类。空间域增强主要是通过改变像元及相邻像元的灰度值达到增强的目的。而频率域增强则是通过对图像进行傅里叶变换后改变频域图像的频谱来达到图像增强的目的。此外,根据图像处理的范围又可以将增强处理技术分为全局(整幅图像)处理和局部(部分图像)处理两种。
2.4 图像融合
图像融合也是信息融合的一种,它把针对同一目标或场景的由相同或不同传感器、相同或不同成像方式、同时相或不同时相获得的多个图像,通过一定的融合规则取长补短变成一幅能反映多重原始图像信息的、能对目标或场景做综合描述的融合图像,以便于进一步处理。
高效的图像融合方法可以根据需要综合处理多源通道的信息,从而有效地提高了图像信息的利用率、系统对目标探测识别地可靠性及系统的自动化程度。其目的是将单一传感器的多波段信息或不同类传感器所提供的信息加以综合,消除多传感器信息之间可能存在的冗余和矛盾,以增强影像中信息透明度,改善解译的精度、可靠性以及使用率,以形成对目标的清晰、完整、准确的信息描述。
依据在融合处理流程中所处的阶段,按照信息的抽象程度及目标识别层次上,可以将图像融合分为三个层次,即像素级融合,特征级融合和决策级融合三种。
2.5 图像裁剪与拼接
图像裁剪顾名思义就是将图像中的感兴趣区域提取出来。而图像拼接技术则是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。图像配准和图像融合是图像拼接的两个关键技术。
图像配准就是对同一景物在不同时间、用不同探测器、从不同视角获得的图像,利用图像中公有的景物,通过比较和匹配找出图像之间的相对位置关系。一般而言,图像配准方法包括特征空间、搜索策略和相似性推测三个部分。图像配准技术经过多年的研究分为三个基本类别:基于灰度信息的方法,基于变换域的方法和基于特征的方法。
图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的创新。
2.6 图像压缩与编码
图像的压缩与编码所解决的问题是尽量减少表示数字图像时所需要的数据量。减少数据量的基本原理是出去其中多余的数据,以数学的观点来看,这一过程实际上就是将二维像素阵列名变换为一个在统计上无关联的数据结合,这种变换在图像存储或传输之前进行。经典压缩编码方法有:哈夫曼编码,算术编码,游程编码、变换编码等。
3 GIS平台与图像处理
GIS是近些年迅速发展起来的一门空间信息分析技术,它是一个综合的学科产物,随着计算机科学、地理学、数学、测绘等学科的发展而飞速发展。GIS不仅可以有效地管理具有空间属性的各种资源环境信息,对资源环境管理和实践模式进行快速和重复的分析测试,便于制定决策、进行科学和政策的标准评价,而且可以有效地对多时期的资源环境状况及生产活动变化进行动态监测和分析比较,也可将数据收集、空间分析和决策过程综合为一个共同的信息流,明显地提高工作效率和经济效益,为解决资源环境问题及保障可持续发展提供技术支持,GIS平台建设也是电网建设的重点项目之一。
数字图像处理是GIS平台的底层操作基础,如GIS中的编辑、查询、存储等都是运用了数字图像处理的理论。GIS图像的像源多源自遥感影像,图像处理技术则贯穿于从遥感影像成像到进入决策分析的全过程。在GIS的发展中也会越来多用到遥感影像处理技术,并且GIS要实现动态分析需要处理海量数据,图像压缩与编码技术则是不可或缺的解决方案。
4 结语
本文致力于将电网GIS平台可能会涉及的图像处理技术对读者进行简要说明,让读者对其产生感性认识。其内容包括但不限于上文中所提到的领域,图像处理技术的发展日新月异,且领域也在不断扩展,相信未来会有更多、更先进的图像处理方法会应用于电网GIS中,以不断提高分析决策水平。
参考文献:
[1] 冈萨雷斯.数字图像处理[M].北京:电子工业出版社,2007.
[2] 汤晓春.遥感图像增强方法的研究及实现[D].华中科技大学,2008.
[3] 廉明.遥感中的几何校正技术[D].北京化工大学,2007.
[4] 宋智礼.图像配准技术及其应用的研究[D].复旦大学,2010.
中图分类号:TM76 文章编号:1009-2374(2016)21-0047-03 DOI:10.13535/ki.11-4406/n.2016.21.023
1 概述
随着信息技术的发展,人类逐渐步入信息化时代。在此过程中所引起的信息革命给许多传统行业带来了巨大的冲击,信息化时代的四大特点――智能化、电子化、全球化、非群体化成为了许多行业变革的风向标。而信息化时代的代表性象征――计算机在各行各业中的必要性与日俱增,在电力行业中也不可避免。
而电力行业作为关乎国计民生的传统行业,在信息化时代中也面临着如何更高效地利用能源、如何更安全可靠地供电、如何更好地了解用户需求等诸多方面的新挑战,于是“智能电网”的概念应运而生。
2 智能电网
2.1 智能电网的概念
智能电网是将信息技术,如通信技术、传感技术、计算机技术和控制技术等融入电力系统之中,使整个电力系统更加安全可控,成为高效智能的新型电网。由于各国的国情不同,因此各个国家对智能电网的具体要求也会有不同的侧重点。因为我国还是一个发展中国家,与国外发达国家的电力工业已步入成熟期不同,我国在发展智能电网的同时,还需要加强骨干电网建设。因此除了要建设能够充分满足用户对电力的需求和优化资源配置,确保电力供应的安全性、可靠性和经济性,满足环保约束,保证电能质量,适应电力市场化发展的坚强智能电网外,我国的智能电网建设还需要满足以特高压电网为骨干网架,各级电网高度协调发展。
2.2 智能电网的特点
智能电网一般包括有以下七个特点:
2.2.1 能量互联网:智能电网要求实现供电方和用户之间的交互,构建多向电力流,它主要由能量管理系统和配电管理系统组成。其中能量管理系统提供整个电网的实时状态信息,并根据实时信息选择最优发电方案,减少输电损耗,维护系统可靠性以确保供电稳定;配电管理系统提供配电网络的实时状态信息,允许供电方远程控制断电的隔离与恢复,管理可再生能源发电。
2.2.2 降低损耗:智能电网能够基于“能量互联网”中的实时信息,根据用户的需求来供电,通过电压控制来降低电力损耗。同时还可以沿输电线放置传感器和电容器,通过无功负载控制来减少电力损耗。减少电力损耗的同时还会降低二氧化碳的排放量,使电网系统更加低碳环保。
2.2.3 融入可再生能源发电:目前可再生能源发电的最大缺点在于可变性过大,产电不稳定。智能电网能够通过储电技术,在产电过剩时将多余电能存储起来,在供不应求时再通过智能电网的自动化技术供能,进而解决可再生能源产电不稳定的问题。
2.2.4 减少输电阻塞:智能电网能够检测输电线的实时度数,在可能发生输电阻塞时,传感器和控制器会及时地重新安排电力输送线路,使得电力能够最大限度地流过线路而不发生阻塞。
2.2.5 分布式发电:通过智能电网的双向电力流,用户自行通过太阳能、风能等可再生能源产生的电力可以出售给供电方,流入配电网络中,使电网系统在用电高峰期可以为用户提供更稳定的供电服务。
2.2.6 自愈:智能电网能够基于实时测量的概率风险评估确定最有可能失败的设备、发电厂和线路,及时进行隔离和恢复,从而减少大面积用电故障的出现。同时,智能电网还能实时分析电网的整体健康水平,及时触发可能导致电网故障发展的早期预警,并根据具体情况确定是否立即进行检查或采取相应措施。
2.2.7 用户需求管理:智能电网能够通过智能电表实时通知用户其电力消费成本、实时电价、电网的状况、计划停电信息等信息,使用户可以根据这些信息制定自己的电力使用方案,继而通过影响用户需求来促进电力供求平衡。
2.3 智能电网的相关技术
智能电网的关键基础技术主要包括集成的通信技术、先进的传感和测量技术、先进的电网设备技术、先进的控制技术以及决策支持和可视化技术。
3 计算机科学在智能电网中的应用
在电网智能化的过程中,计算机是必不可少的。而计算机科学在智能电网中也有诸多应用,其中云计算、数字图像处理、数据挖掘、人工智能和软件工程这些计算机科学相关技术在智能电网中尤为重要。
3.1 云计算
云计算是分布式计算的一种特殊形式,根据美国国家标准与技术研究院的定义,云计算可以实现随时随地、便捷、按需地从可配置计算资源共享池中获取所需的资源,资源可以快速供给和释放,使管理的工作和服务提供者的介入降低至最少。
云计算技术能够整合优化电网系统中的各种异构资源,如电力系统中的监控维护资源、配电管理资源和市场运营资源等。利用云计算支持广泛企业计算和普适性强的特点,能够构建更加高效的智能电网数据中心,实现基础设施资源的自动化管理。例如利用Google的Borg能够使大量服务器协调工作,继而实现大规模系统的可靠性管理。
而智能电网信息系统所产生的大量数据,更需要通过云计算来实现分布式存储和管理。利用云计算来实现海量数据的分布式存储,可以通过冗余存储和高可靠性软件来提高数据的可靠性,并能较好地达到成本、可靠性和性能的最佳平衡。例如利用Google的GFS文件系统可以实现数据的冗余存储,并大幅度降低主服务器的负担,使系统IO高度并行工作,从而提高系统的整体性能。智能电网所产生的数据种类众多,而云计算的数据管理技术能够较好地满足智能电网信息平台数据种类繁多的海量服务请求,因此云计算能够高效地管理智能电网信息平台中的多元数据。例如,利用Google的BigTable,通过一个巨大的分布式多维数据表,将数据都作为对象,并通过关键字、列关键字和时间戳来进行索引,满足各类数据的性能要求,进而实现多元数据的高效管理。
为了保证电网系统运行的安全稳定,智能电网需要通过大规模的电力系统计算来监控整个电网系统的运行状态,如暂态稳定计算、故障计算、拓扑分析、数据挖掘与智能决策等,计算量极大,而云计算可以为智能电网提供高性能的并行计算与分析服务。例如利用Google的MapRduce,可实现针对大规模数据集的并行计算。
3.2 数字图像处理
数字图像处理是指通过计算机对图像进行去噪、增强、复原、分割以及提取特征等处理,从而改善图示信息,以便人们解释或机器自动理解。
在智能电网系统所产生的海量数据中有不少的数据都是图像数据,例如对输电线路状态的远程监测常常通过线路图像/视频监控系统来实现。为了能够实现对输电线路状态全天候全方位的实时监控,采用智能化和自动化的手段来代替人工是必然的趋势。但原始图像中包含的噪声太多了,价值密度低,难以用于智能识别。在这种情况下,可以通过数字图像处理中的灰度变换、直方图修正、小波包去噪、图像锐化以及边缘检测等处理方式来增强图像对比度,去除噪声,加强图像的轮廓特征,以便于特征的提取和识别,进而产生价值密度较高的特征数据集,为输电线路状态的智能识别过程做好图像数据的预处理。
3.3 数据挖掘
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘的方法包括分类、聚类、关联分析、预测等。
由于智能电网系统中的数据具有数据量巨大、数据类型繁多、价值密度低以及处理速度快的特点,智能电网系统中的数据属于无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的“大数据”,需要通过数据挖掘来提取其中隐含的有价值的信息,从而实现对整个电网系统多角度、多层次的精确感知。例如,通过对长期的、大量的用户用电数据进行数据挖掘,对不同地区以及不同用户进行分类,可以得到有助于优化配电调度的信息,并能为电费定价调整提供参考;由于在当今社会中各行业的发展都离不开能源的使用,因此对用电数据进行挖掘甚至还可以归纳总结出各种指标增长率与社会用电情况的一般规律,便于政府了解和预测社会各行业发展状况及用能情况,为政府决策提供参考。而通过对长期的、大量的电动汽车充电数据进行数据挖掘,可以为充电站的布点提供参考。通过对长期的、大量的可再生能源发电情况进行数据挖掘,有利于降低可再生能源产电不稳定对供电网络的影响,进而更好地融入可再生能源发电。此外,数据挖掘还有利于用户能效的分析管理、业务拓展分析、供电舆情监测预警分析、电力系统的故障预测和状态检修、短期电网负荷预测、城市电网规划等。智能电网系统的数据特性表明了数据挖掘在智能电网中有着广泛的应用。
3.4 人工智能
根据著名人工智能科学家Michael R.Genesereth和Nils J.Nilsson在1987年提出的定义,人工智能是研究智能行为的科学,它的最终目的是建立关于自然智能实体行为的理论和指导创造具有智能行为的人工制品。人工智能是一门研究如何将人的智能转化为机器智能或者用机器来模拟或实现人的智能的学科。
数据挖掘在智能电网中有着广泛的应用,而数据挖掘需要人工智能技术来提供数据分析的技术支持,因此人工智能在智能电网中也有着十分重要的应用。例如,通过构建人工神经网络来对经过数字图像处理所得的典型线路状态的监控图像特征数据集进行训练识别来实现输电线路状态的智能识别。除了故障诊断外,人工神经网络还可应用于智能控制、继电保护、优化运算等
方面。
除了为数据挖掘提供数据分析的技术支持外,人工智能还可以通过人类专家提供的经验和知识来构建相应的专家系统,如电网故障诊断和调度处理专家系统和操作票专家系统等,模拟人类专家解决问题的过程来进行决策,从而实现电网自动化和智能化。
而采用遗传算法、粒子群算法等进化算法求解诸如发电厂和输电线架设的规划问题以及电力系统中各种控制参数的最优解等问题或利用模糊集理论来处理电力系统中难以实现精确控制的复杂问题,也是人工智能在智能电网中的重要应用。
3.5 软件工程
根据Fritz Bauer在NATO会议上给出的定义,软件工程是建立和使用一套合理的工程原则,以便获得经济的软件,这种软件是可靠的,可以在实际机器上高效的
运行。
为了便于管理和使用,无论是供电管理方还是用户方都会希望通过一个稳定可靠,功能完备,并具有友好人机界面的软件来方便操作。因此在建设智能电网的过程中势必需要开发相应的软件,软件工程便应用于其中。尤其是对用户端而言,在移动设备使用越来越广泛的今天,开发相应的移动端的APP无疑能够更好地促进用户参与到交互过程中。一个针对用户个体,能够实时显示如电力消费成本、实时电价、电网状况、计划停电信息等的智能电表提示信息,结合数字家庭技术,能够远程控制家电开关以便于用户随时随地调整自己的用电情况,并整合线上业务申请、缴纳电费等功能的APP能够极大程度地减轻用户的操作负担,方便用户的使用,使智能电网更加高效智能。
4 结语
计算机科学在智能电网中的广泛应用使电力行业在信息化时代中能够更好地应对各种新挑战,为整个社会的发展带来深远的影响。
参考文献
[1] 肖世杰.构建中国智能电网技术思考[J].电力系统自动化,2009,33(9).
[2] 李乃湖,倪以信,孙舒捷,等.智能电网及其关键技术综述[J].南方电网技术,2010,4(3).
[3] 杨德昌,李勇,C.Rehtanz,等.中国式智能电网的构成和发展规划研究[J].电网技术,2009,33(20).
[4] 王德文,宋亚奇,朱永利.基于云计算的智能电网信息平台[J].电力系统自动化,2010,34(22).
[5] 彭小圣,邓迪元,程时杰,等.面向智能电网应用的电力大数据关键技术[J].中国电机工程学报,2015,35(3).
[6] 宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4).
[7] 张东霞,苗新,刘丽萍,等.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1).
[8] 金华,王民,昝涛,等.基于数字图像处理的输电线路状态智能识别技术[J].微计算机信息,2012,28(4).
[9] 韩祯祥,文福拴,张琦.人工智能在电力系统中的应用[J].电力系统自动化,2000,24(2).
1 引言
近年来,人们提出了许多方法用于检测和跟踪序列图像中的运动目标,但是由于受到计算机速度和算法复杂度的限制,使得在检测和跟踪运动目标的实时性和鲁棒性方面总是不太理想。同时在设备不断小型化、集成化、网络化的今天,FPGA由于其可编程的特点成为嵌入式开发的最佳平台。因此,本设计核心模块为Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心处理器,以提高系统的整体的性能。[1]
2 系统工作流程和原理
系统主要由一体化摄像机、高速数字云台、视频解码器SAA7113H、图像存储器SRAM,FPGA控制器、以太网模块、监视器、报警模块等部分构成。
该跟踪系统的工作过程为:系统开机后FPGA加载程序,然后根据算法对采集到的图像进行处理,获得控制云台的参数并传递给云台控制器,从而跟踪目标运动。具体实现过程:摄像头安装在跟踪转台上,摄像头输出的电视制式的信号(含有图像和同步、行场消隐信号)一路送到监视器上进行实时监视,另一路经过视频预处理,经过SAA7113变换后送入图像处理单元FPGA进行图像处理,图像处理单元首先形成一个检测(波门)窗口,然后在窗口中检测、识别、提取出目标图像信号,确定出目标在当前帧观测图像中的精确坐标,经计算得到相对于摄像头瞄准线的偏差量,送至伺服机构,云台输出控制信号控制步进电机转动,带动云台上的摄像头转动,使目标始终处于视场中心,从而达到跟踪的目的[2]。通过以太网上传目标坐标数据,用于进一步分析。
3 装置硬件的具体实现
本装置对核心处理器、视频解码芯片,以太网模块等器件的选择关系到整个装置的性能和价格,即选择性能价格比高且能满足设计需要的器件。
3.1核心处理器选择
处理器需要根据算法及实际被测目标对处理能力的要求来选择。目前的处理器主要有单片机、ARM、DSP、FPGA等等。本装置核心模块主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,该芯片有149760个逻辑单元,RAM 635520 bit, 8个锁相环,用户I/O 508个,芯片具有很高的性价比,还支持SOPC ,从而完成各模块功能,并协调整个系统工做。芯片功能很强大,为以后系统升级,算法改进,数据量增大提供很大空间。
3.2 视频解码芯片SAA7113 和以太网W5100配置
为了使视频解码芯片SAA7113H可以按照预想的方式工作,需要对其进行初始化,视频解码芯片为I2C串行总线,在上电后首先修改SAA7113H的内部寄存器的数值,进行正确初始化[3]。
W5100是一款多功能的单片网络接口芯片,内部集成10/100以太网控制器,内部集成为全硬件形式,且具有经过多年市场验证的TCP/ IP协议栈,太网介质传输层MAC和物理层PHY 硬件,TCP/IP等协议已经在很多领域经过多年验证[4]~[5]。
W5100内部集成有16KB的存储器用于数据传输,使用W5100不需要考虑以太网的控制,只要进行简单的端口SOCKET编程。此外,其接口非常简单,可选择SPI接口。
对上述两个模块的设计采用SOPC方法,SOPC是一种用于嵌入式开发的片上可编程系统,设计灵活,可剪裁,可升级软硬件在系统可编程的功能,运用FPGA 的NIOS II 对 I2C,对SPI口配置过程为:运行QUARTUS II 软件中的SOPC BUILDER 添加I2C,SPI 模块,从而构成功能强大的32位NIOS嵌入式系统。
4 目标的跟踪定位
确定目标位置的方法分两类,即波门跟踪和相关跟踪算法。本文采用形心跟踪算法,该算法对跟踪窗内的数字图像处理得到一阈值,再从跟踪窗内的数字图像中分割出目标像元,然后根据分割出的全体目标像元位置数据和目标像元的点数,计算出目标的形心,目标的形心相对于视场中心的位置数据则作为目标偏差数据[6]。
5 结论
本文介绍了一种移动目标跟踪装置。该装置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N为核心处理器。通过以太网上传的跟踪信息来看,看该系统取得了较好的跟踪效果,实验结果证明该装置能够很好的适应目标检测和跟踪算法,该装置对运动目标监视和跟踪产品有一定的参考意义。
参考文献
[1]杨宜禾,周维真.成像跟踪技术导论[M].西安电子科技大学出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分图像的多运动目标检测与跟踪[J].中国图形图像学报,1994(6).
[3]郝迎吉,刘青,徐凌志.基于EPP和FPGA的CMOS图像传感器的数据采集[J].电子设计应用,2002(01).
[4]黄钉劲,阮照军,王刚,郭小莉.基于FPGA的图像采集与远程传输系统设计[J].西安工业大学学报,2008.
[5]放璐,杨天怡,牟万军.数字图像远程监控系统的组网方式[J].电子产品世界,2002(21).
0 引言
图像复原技术是当今图像处理研究领域的一个重要分支。目的是去除或减轻在获取数字图像过程中发生的图像质量下降即退化的问题,从而使图像尽可能接近真实的场景。景物形成过程中可能出现畸变、模糊、失真或混入噪声,使所成图像降质,则称为图像的“退化”。
运动模糊图像的产生原因可能是由于摄像机与被摄物体之间的相对运动或曝光瞬间相机抖动造成的。通过硬件上的去模糊技术并不容易实施且往往价格昂贵。因此,软件补偿非常流行。先通过数学方法将运动模糊建模为点扩展函数(psf)与图像的卷积。再由去模糊方法如迭代算法Lucy-Richardson或非迭代算法 Wiener 算法[1]或更复杂的方法如Bussgang算法[2]重建原始图像。由于清晰的源图像信息是未知的,因此为了重建图像需要估计点扩散函数。很多方法估计psf已经发展的很好[3-4]。估计点扩散函数的方法很大程度依赖于特定类型的图像如天文学和天体物理学的照片,电脑断层扫描图像,或显微镜图像。本文提出一个估计点扩散函数参数的新方法。对图像先进行预处理,在做参数识别和复原滤波,从而更准确的恢复清晰图像。实验结果证明本文方法效果较好。
1 图像恢复方法的数学模型
2 快速恢复算法
2.1 点扩散函数的估计
如果引起图像退化的点扩散函数具有零点,这些零点就会迫使退化图像的频谱在某些特定的频率上变成0,表现在频谱上就会出现一系列暗线。对于水平匀速直线运动的模糊图像而言,会在n/L处存在零点,其中n为整数,L为模糊的长度,因而图像在频率平面上存在一些垂直的等间距直线。对于任意方向运动模糊图像,例如β方向的模糊图像,其频谱一定在β+90°的方向存在暗线。图像频谱暗线的个数即为图像实际运动的距离,单位为像素。图1(a)显示lena图像由于运动模糊降质退化。在傅里叶频谱的图像中,如图1(b)平行深色的线条是显而易见的。
2.2 去模糊的新算法
4 结论
本文提出了一个精确性、鲁棒性较好的方法恢复模糊图像。对图像去模糊之前先做预处理,利用Butterworth带通滤波器先进行滤波,再结合Radon变换和Richardson-Lucy(RL)算法进行复原。实验结果证明本文算法能获得较好结果。
实际上,图像复原算法很多,无法判断哪种更好,只是适用的领域不同,因此本文还有改进空间,可以使该算法适合更多更广泛的图像。
【参考文献】
[1]程姝,赵志刚,吕慧显.顺序结构的运动模糊图像复原技术综述[J].计算机应用,2013(S1):161-165,185.
[2]S. Colonnese, P. Campisi, G. Panci, G. Scarano, Blind image deblurring driven by nonlinear processing in the edge domain, EURASIP J. Appl[Z]. Signal Process. 16 (2004):2462-2475.
[3]赵志刚,程姝,王国栋.基于运动估计的模糊图像盲复原[J].光电子・激光,2012,(10):2010-2016.
[4]M.A. Santiago, G. Cisneros, E. Bernues, Iterative desensitisation of image restoration filters under wrong PSF and noise estimates, EURASIP J. Adv[Z]. Signal Process(2007), Art. No. 72658.
中图分类号:C37 文献标识码:A
一、概述
随着计算机视觉技术的发展,近年来利用机器视觉直接观察焊接熔池,对焊
接质量进行闭环控制是通过图像处理获取熔池的几何形状信息,已是当前研究的主要方向。
和传统的手工焊和半自动焊接过程相比,使用机器视觉进行直接观测焊接熔池有着很明显的优点,采集的数字图像信息丰富,表象直观,且数字化的图像数据可以实时传输到计算机高速缓存内,提取特征信息, 进行实时处理,同时作出在线判决,可以实现焊接过程质量实时控制和传感。
在传统的手工焊接和半自动焊接过程当中,对于一个有经验的焊工,通过直接观察熔池的行为、接头的位置、焊道外形及电弧形状,能够感知焊接的状态。若是感觉到实际焊接过程中同最佳状态不一致,为了达到最佳状态可以通过调节各参数,以获得高质量的焊缝。可以把这个过程划分为眼-脑-手的控制过程。图像处理在焊接过程中的重要意义就等同于手工焊接过程中人的眼睛,可以实现采集和处理焊接位置的传感、焊接时熔池、焊道对中、熔宽和熔深的信息,然后利用计算机发出指令,实现焊接过程的各种工艺参数如电流、电压、焊接速度的调节和电弧或焊丝的对中。
二、图像处理的概念
图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。一般图像处理就指的是对数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,匹配、描述和识别以及增强和复原这3个部分。常见的处理包括有图像复原、图像数字化、图像增强、图像编码、图像分析和图像分割等
三、焊接图像摄取方法
图像的处理一般包括量化、图像识别和图像预处理等几个步骤。图像预处理包括图像增强、图像变换和图像恢复,尽量把因为随机因素的干扰和摄像中各种条件的限制而产生的不足和噪声减小,继而可以获取焊缝位置的精确信息;量化由图像卡完成;图像识别包括边缘提取和图像分割等,可借助小波变换、快速傅立叶变换、概率统计等数学工具对图像进行理解、分析、模式识别和特征提取。
从国内外大量文献来看,利用机器视觉采集焊接熔池图像的方法主要分为被动式直接视觉传感和主动式直接视觉传感两大类,视觉传感器常采用CCD摄取原始图像。CCD是英文(Charge-Coupled Devices)的缩写,意即“电荷耦合器件”。具有体积小、耐震动、重量轻、稳定性好、寿命长、速度高,几何失真小及耐高压等一系列优点。CCD是固态图像传感器的一种,固态图像传感器是指把布设在半导体衬底上的许多感光小单元的光-电信号,用所控制的时钟脉冲读取出来的一类功能器件。
动式直接视觉传感利用窄带复合滤光系统滤除非连续光谱的电弧强光,并采用高强脉冲激光或具有图像增强器的高频闪光灯作为辅助光源,可有效地抑制弧光获得清晰图像。被动式直接视觉传感是利用焊接过程中的结构光进行成像。主被动式直接视觉传感存在强光干扰的问题,激光焊接中,通常采用中性减光的办法解决强光干扰的问题;在电弧焊中,对于短路电弧焊和脉冲电弧焊.可在短路期间或基值电流期间获取图像数据,或者在摄像机前通入部分保护气,减少烟雾和飞溅的影响;TIG/MIG/MAG焊时弧光在600~700nm波段内相对光强最弱最稳定,选用这一波段内的干涉滤光片和防热玻璃可有效地排除弧光及红外干扰。
四、图像处理在焊接中的应用
现如今,对于图像处理主要集中应用在脉冲机器人焊接、TIG焊、激光焊和焊缝质量的检测等领域。图像技术在机器人焊接领域应用较广。由于机器人需要有很强的适应能力,借助三维视觉传感系统和计算机图像处理技术,焊接机器人可对焊接环境进行实时控制。通过图像的采集,可帮助机器人进行焊缝的对中,为机器人焊接提供实时特征信息,如熔深、熔宽和熔池的形状等,从而实现焊接过程的智能控制。目前国内哈工大的吴林教授在这方面作了较深入的研究,从焊缝位置的传感到熔滴的过渡,从过程实时控制到最后焊接质量的检测都进行了较为系统的研究。
哈工大的何景山博士在脉冲TIG焊熔深及熔透的彩色图形法传感方面进行了较深入的研究。图像处理目前用得最广的领域是在脉冲TIG焊中,国内外许多学者都对该领域进行了积极的探索。首先创建了一套适用于脉冲TIG焊的彩色图像法熔深和熔透的传感系统,通过对脉冲峰值和脉宽的控制实现对熔深和熔透的控制,其控制信息来源于基值期间,进行图像信息的采集。
此外,图像处理还在焊接的其它领域中有一定的应用。有的将图像处理用于焊接缺陷的自动监测与缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者还将图像处理用于水下湿法焊接,通过复合滤光技术和水下CCD摄像系统,采集出了药芯焊丝水下湿法焊接电弧区域的图像,用中值滤波和梯度算子的电弧区域图像边缘检测方法,有效地区分了电弧燃烧区域和电弧气泡区域。哈尔滨工业大学的何景山、杨春利等人结合采用埋弧焊进行容器类焊接结构制造过程中的工艺特点及实际工况,设计了一种将微型摄像机、微型半导体激光发生器及具有滤光功能的光学系统三者集成一体的焊缝视觉传感器。
焊接控制过程中的一个重要环节就是焊接缝隙检测,图像处理在这方面的应用也有许多学者研究。为了实现电弧焊过程的自动对中和焊缝质量控制,必须对焊接缝隙的相对位置和坡口几何参数进行检测。西安交大的梁晋、贾昌申等在《图像法焊接缝隙检测的研究》一文介绍了一套自行设计的计算机焊接缝隙检测系统,包括图像采集卡、计算机接口、光学传感器、图像处理软件,分析了它们的基本结构和工作原理,讨论了提高光学传感器、图像处理软硬件等抗干扰能力的措施。该系统工作原理是:由光源和CCD摄像机组成的光学传感器摄取图象,CCD摄像机把图象转换为电信号,再经图象采集卡把模拟信号变为数字信号存储于计算机内,计算机对此信号进行必要的处理,即可得到缝隙位置和坡口几何参数信息,在监视器屏幕上显示出来,或经过D/A电路给执行机构,修正焊枪位置,实现闭环对中控制。有的将图像分割和小波分析应用于焊接领域,小波分析在焊缝视觉跟踪过程中检测焊缝,采用多次小波变换可获得清晰的焊缝边缘,大大简化了硬件设备;图像分割法可减小焊缝识别的图像处理的复杂性,使得焊接过程的实时性增强。
五、图像处理在焊接中应用的展望
为焊接现象的描述及内在规律的解释提供了极佳的条件和直接的证据,推动焊接理论和实践的发展就是通过图像传感的这种方法。同时也使得研究者能够观察到其它传感方法所不能观察到的被强光所淹没的丰富直观的信息。
把图像处理技术应用到现代焊接技术中,将会推动焊接过程质量实时传感与控制的发展和成熟,使得焊接过程通过闭环反馈控制而实现完全自动化,保证焊接质量,提高焊接生产效率。
总之,作为智能控制中关键技术―数字图像技术,在焊接过程中发挥的作用将会越来越大,将为焊接智能化生产作出贡献。现代工业正朝着信息化和智能化方向发展,现代焊接技术也必然要实现智能化。
参考文献:
[1]段佳佳,杨迎春.图像处理在自动焊接中的应用[J].电子测试,2012,02:12-15.
[2]陈彦宾,李俐群,陈凤东,陈杰.图像处理在自动焊接中的应用和展望[J].材料科学与工艺,2003,01:106-112.
中图分类号:TP3 文献标志码:A 文章编号:1006-8228(2015)01-26-03
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
图像分割是数字图像处理中的一项关键技术,它通常用于对图像进行分析、识别、编码等处理之前的预处理环节,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。自上世纪70年代以来,已经出现了多种图像分割方法,而每一种图像分割方法都是为了解决一些特定的应用问题。该技术成功地应用于许多领域,例如:交通路口的电子警察、光学字符识别(OCR)、指纹识别、机动车牌号识别等等。
图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。好的图像分割应具备的特性:①分割出来的各区域对某种性质如灰度、纹理而言具有相似性,区域内部比较平整;②相邻区域对分割所依据的性质有明显的差异;③区域边界上是明确和规整的[1]。
大多数图像分割方法只是部分满足上述特征。如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;若强调不同区域间性质差异的显著性,则易造成不同区域的合并。具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。
虽然图像分割方法已经有了很大的发展,但由于它的复杂性,仍有很多问题没有很好地得到解决。因此,人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。实践表明,对图像分割理论与技术的进一步研究仍然具有非常重要的意义。
本文首先对数字图像分割的一些经典分割方法作了概述,然后分析了现有项目开发中使用的图像分割方法所存在的问题,最后基于经典算法进行技术改进,实现了一种新的分割方法,并将其应用到实际的产品当中,取得了良好的效果。
1 图像分割方法的现状
从上世纪五十年代开始,学者一直热衷于研究图像分割技术。迄今为止,已提出上千种图像分割算法,依这些算法对图像处理的特点,主要可分为以下几类方法[2]。
1.1 阈值分割法
阈值分割法作为一种常见的区域并行技术,它通过设置阀值,把像素点按灰度级分若干类,从而实现图像分割。由于是直接利用图像的灰度特性,因此计算方便简明、实用性强。显然,阈值分割方法的关键和难点是如何取得一个合适的阈值,而实际应用中阈值设定易受噪声和光亮度影响。近年来关于阈值分割法主要有[3]:最大相关性原则选择阈值法、基于图像拓扑稳定状态法、灰度共生矩阵法、熵法、峰值和谷值分析法等。其中,自适应阈值法、最大熵法、模糊阈值法、类间阈值法是对传统阈值法改进较成功的几种算法。更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。例如,将图像的灰度直方图看作是高斯分布的选择法与自适应定向正交投影高斯分解法的结合,较好地拟合了直方图的多峰特性,从而得到了更为准确的分割效果。阈值法的缺陷主要在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。对于非此即彼的简单图像处理(如一些二值图像的处理)是有效的,但是对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题则难以得到准确的分割效果。
1.2 基于边缘的图像分割法
边缘总是以强度突变的形式出现,可以定义为图像局部特征的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始,图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,还保护了目标的边界结构。对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。
当今的局部技术边缘检测方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,但对于边缘复杂(如边缘模糊、边缘丢失、边缘不连续等)的图像效果不太理想。此外,噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,然后再用拟合光滑函数的导数来代替直接的数值导数,如Marr算子、Canny算子等。有关学者曾给出了一种基于彩色边缘的图像分割方法,这是对传统边缘分割方法只适用于灰度图像状况的一个突破。
在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取,以及如何确认重要边缘去除假边缘将变得非常重要。
1.3 基于聚类的分割法
对灰度图像和彩色图像中相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。此方法的实质是将图像分割问题转化为模式识别的聚类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。常用的聚类分割有颜色聚类分、灰度聚类分割和像素空间聚类分割。
颜色聚类分割实际上是将相似的几种颜色合并为一色,描述颜色近似程度的指标是色差,在标准CIE匀色空间中,色差是用两个颜色的距离来表示的。但是显示器采用的RGB空间是显示器的设备空间,与CIE系统的真实三原色不同,为简单起见,一般采用RGB色空间中的距离来表示。
灰度聚类分割就是只把图像分成目标和背景两类,而且仅考虑像素的灰度,这就是一个在一维空间中把数据分成两类的问题。通过在灰度空间完成聚类,得到两个聚类中心(用灰度值表征),聚类中心连线的中点便是阈值。显然这个概念也可以轻松地延扩至多阈值和动态阈值的情况。
像素空间聚类分割在某些特定的尺度上观察图像,比如说把图像信号通过一个带通滤波器,滤波的结果将使图像的局部信息更好地被表达。通过一个多尺度分解,轮廓信息可以在大尺度图像上保留下来,细节或者突变信息可以在中小尺度上体现,基于多尺度图像特征聚类的分割方法渐渐得到了人们的关注。
1.4 函数优化法
基于函数优化的分割方法是图像分割中另一大类常用的方法,其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像,G.A.Hewer等人提出了一个具有广泛意义的目标函数。统计学分割法、结合区域与边缘信息法、最小描述长度(MDL)法、基于贝叶斯公式的分割法等是目前几种活跃的函数优化法。
统计学分割法就是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。统计学分割方法包括基于马尔科夫随机场法(MRF)、标号法(Labeling)和混合分布法(Mixture)等。
结合区域与边缘信息法是基于区域信息的图像分割的主要方法。区域增长有两种方式:一种是先将图像分割成很多一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的;另一种是事先给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的。分裂合并法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点,其基本思想是给定相似测度和同质测度,从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域;如果两个邻域的子区域满足相似测度则合并。
最小长度描述法(MDL)的基本思路是用一种计算机语言来描述图像的区域和边界信息,得到一个描述长度函数,以此作为目标函数,根据图像极小化描述长度从而得到分割结果。MDL准则主要应用于区域竞争中,即通过这种规则对比若干个种子区域,找出其中的坏种子。它常常与其他方法结合使用。
2 图像分割技术的研究与应用
2.1 图像扫描分割
根据实际产品的需要,要根据分割的特殊要求,采用简单的图像扫描分割。
2.1.1 算法思想
获取二值化要分割的图像,然后转换为图像指针并获取图像的左右边界、上下边界,然后再分割图像[4]。
2.1.2 分割过程实现
下面介绍基于FrameWork4.0,采用C#实现对图像进行分割处理的主要步骤。
⑴ 二值化要分割的图像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 转换为图像指针并获取图像中的左右边界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 获取图像的上下边界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割图像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 实际效果
存在干扰情况下的分割效果,如图1所示。
<E:\方正创艺5.1\Fit201501\图\ww图1.tif>
图1 图像扫描分割
图像扫描分割的结果存在多干扰点,一些字符不能完整地被分割出来,多个字符连接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
该算法是提取图像的轮廓信息,一个轮廓一般对应一系列的点,也就是图像中的一条线[5]。在算法中用序列cvSeq来保存提取到的序列集,序列中的每一个元素就是曲线中的一个点的位置。
2.2.2 分割过程实现
下面介绍采用C++实现对图像分割处理的主要步骤。
⑴ 图像的预处理(二值化、平滑处理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找图像的联通区域及轮廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 对轮廓进行转换得到内容区域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 图像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 实际效果
从分割结果看,该分割算法能把所有的单个图片联通区域分割出来,但是分割出的区域存在很多干扰区域,增加了实际区域提取的复杂度(见图2)。
<E:\方正创艺5.1\Fit201501\图\ww图2.tif>
图2 连通区域分割
下面将在此基础上进行改进。
2.3 改进后的算法
增加连通区域的有效性判断及过滤;
checkSplitRect(Rect rect,int height,int width)
同时对一些单字符被分割成多个字符的区域按照一定的算法及规则进行有效组合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如图3所示,将所有字符正确的分割出来,去除了干扰,达到了理想的效果。
<E:\方正创艺5.1\Fit201501\图\ww图3.tif>
图3 改进后的分割效果
3 实验结果
为了验证本方案的可行性和可操作性,本文使用10000张测试图像作为实验测试库,对此方案进行测试。测试结果:正确分割达到99%以上。如图4,改进后的分割正确率比改进前的分割正确率提高了将近20倍。
<E:\方正创艺5.1\Fit201501\图\ww图4.tif>
图4 分割对比
4 结束语
图像分割没有通用的理论,要根据具体情况采取有效的方法。利用已经研究出的多种图像分割方法,将多种方法综合运用,发挥各自的优势进行图像分割将成为这一领域的发展趋势。同时,由于现在所处理的图像的复杂度和固有的模糊性,传统的单一的处理方法已不能适用需要,与新理论、新工具和新技术结合起来才能有所突破和创新。
本文在原有分割技术的基础上,结合实际的使用情况,进行了算法思想的改进和创新,最终达到了理想的分割效果,在一定程度上具有良好的研究和实用价值。
参考文献:
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 罗希平等.图像分割方法综述[J].模式识别与人工智能,1999.12(3):
300-312
[3] 吴一全,朱兆达.图像处理中阈值选取方法30年(1962-1992)的进