资源描述:
《计算机视觉技术在工业领域中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、浙江工程学院学报,第19卷,第2期,2002年6月JournalofZhejiangInstituteofScienceandTechnologyVol.19,No.2,June2002文章编号:1009-4741(2002)02-0092-05计算机视觉技术在工业领域中的应用黄文清汪亚明周志宇(浙江工程学院计算机视觉与模式识别研究中心,浙江杭州310033)摘要:分析了计算机视觉研究中的某些问题,如计算机视觉的理论基础、它和人类视觉的差异及与其相关的领域。综述了计算机视觉在工业领域中的应用。介绍了工业视觉系统的组
2、成、特点和性能指标,并指出了工业视觉系统的发展方向。关键词:计算机视觉;工业视觉系统;视觉检测中图分类号:TP391141文献标识码:A计算机视觉系统可以快速获取大量信息,且易于同设计信息及加工控制信息集成,现已广泛地应用在[1,2]工业、商业等领域。计算机视觉作为一种检测手段已越来越引起人们的重视,并逐步形成一种新的检[3]测技术)))计算机视觉检测(AutomatedVisualInspection,AVI)技术。1计算机视觉111计算机视觉理论计算机视觉是用计算机模拟人眼的视觉功能,从图象或图象序列中提取信息
3、,对三维景物进行形态和运动识别。对于计算机视觉系统来说,输入是表示三维景物投影的灰度阵列,可以有若干个输入阵列,这些阵列可提供从不同方向、不同视角、不同时刻得到的信息。输出是对图象所代表景物的符号描述,通常这些描述是关于物体的类别和物体间的关系,也可能包括如表面空间结构、表面物理特性(形状、纹理、颜色、材料)、阴影以及光源位置等信息。目前,许多计算机视觉的研究工作都以马尔(Marr)创立的视觉计算理论框架为基础。Marr视觉计算[4]理论认为,视觉可分为三个阶段(见图1)。第一阶段是早期视觉(EarlyVision
4、),目的是提取观察者周围景物表面的物理特性,如距离、表面方向、材料特性(反射、颜色、纹理)等,具体来说包括边缘检测、双目立体匹配、由阴影确定形状、由纹理确定形状、光流计算等;第二阶段是二维半简图(215DSketch)或本征图象(IntrinsicImage),它是在以观察者为中心的坐标系中描述表面的各种特性,根据这些描述,可以重建物体边界、按表面和体积分割景物,由于在以观察者为中心的坐标系中只能得到可见表图1视觉三阶段面的描述,得不到遮挡表面的描述,故称二维半简收稿日期:2001-12-24基金项目:国家自然科学
5、基金资助项目(60103016);浙江省自然科学基金资助项目(601019);浙江省教育厅科研项目(2000036)。作者简介:黄文清(1969-),女,福建连城县人,讲师,在读博士,主要从事计算机视觉与自动控制研究。第2期黄文清等:计算机视觉技术在工业领域中的应用93图;第三阶段是三维模型,是用二维半简图中得到的表面信息建立适用于视觉识别的三维形状描述,这个描述应与观察者的视角无关,即在以物体为中心的坐标系中,用各种符号和几何结构描述物体的三维结构和空间关系。112计算机视觉与人类视觉人类视觉的目标识别能力很强,
6、但也存在障碍,一旦置于某种特殊环境,目标识别能力会急剧下降,使目标识别的有效性和可靠性大幅度下降。将人的视觉引入计算机视觉中,计算机视觉也存在着同样的障碍,它主要表现在3个方面:a)如何准确、高速(实时)地识别出目标;b)如何有效地增大存储容量,以便容纳足够细节的目标图象;c)如何有效地构造和组织可靠的识别算法,并且顺利地实现。前两者相当于如人类大脑般的物质基础,计算机视觉技术需要解决的是如何在此物质基础上,应用高速阵列处理单元及算法(如神经网络、分维算法、小波变换等)上的新突破,以极少的计算量高度并行地实现某些功
7、能。计算机视觉与人类视觉的差异见表1。表1计算机视觉与人类视觉比较计算机视觉人类视觉分辨率有限定量估计感光范围紫外、红外、可见光可见光图象处理方式串行处理,部分并行处理每只眼睛每秒处理(实时)1010空间数据处理速度零点几秒/每帧图象定量估计视觉功能很难实现二维、三维立体视觉自然形成三维立体视觉图象机构需要采用专用软件且能力有限高度发达确定方向能力定量计算定量估计测量距离能力有限定量估计识别阴影能力初级水平高度发达运动分析能力一定条件下的定量分析定量分析对物体的二维解释能力能较好地解释分割完善的目标高度发达对物体的
8、三维解释能力非常低级高度发达识别图像形状能力受分割、噪声影响高度发达检测边界能力对噪声较敏感定量、定性分析总体能力适合于定量测量结构环境适合于定量解释复杂的、非结构化环境113与计算机视觉相关的领域计算机视觉是一个迅速发展的新领域,涉及到人工智能、神经生物学、心理物理学、计算机科学、图象处理、图象理解、模式识别等多个领域,是一门多学科交叉的边缘科学,其中,图