您的当前位置:首页正文

图像智能化的目标检测技术_目标_背景视觉模型

来源:一二三四网
年月北京邮电大学学报第卷增刊文章编号增图像智能化的目标检测技术工景晓军—目标背景视觉模型李剑锋,一张苏慧杨义先北京邮电大学电信工程学院北京摘要主要从物理光学的反射特性神经生理学的视知觉组织理论视觉心理学的格式塔认知原理以及视脑信息的同步化整合概念等方面进行了综合分析阐明了一种视觉计算模型景表征模型为自适应图像目标检测技术提供一条新的探索途径关—目标背键词机器视觉表达模型图像分析目标检测文献标识码中图分类号—以复杂图像环境作为处理对象的自动目标检测是计算机视觉和人工智能领域中一项意义重要任务艰巨的研究工作属图像信息工程的一大经典难题〔〕图像分割作为早期目标检测常用的方法既涉及到图像信息的下层数据处理又涉及到上‘层知识表达是计算机视觉研究中的一个重要问题也是该领域最困难的问题之一分割问题存在的主要原因有两条‘〕一是对生物视觉机理的理解与应用不够二是由于机器视觉技术长期受到过去计算体制的限制所致国内外众多学者对此进行了研究提出了不少应用算法如基于遗传算法的分割技术的遗传算法收稿日期作者简介’〕〕在此基础上为改善算法的理论性又提出了遍历型群体列突变本文在结合探讨生物视觉感知原理的基础上运用数学形态学理论提出一种景晓军一男副教授博士后北京邮电大学学报第卷层次化的图像目标提取处理过程使之在复杂多变的环境中具有良好的检测性能景物成像分析视觉信息的基本描述与表达是计算机视觉理论研究的根本问题它涉及生物视觉神经科学以及数学物理等众多学科人类视觉系统是计算机视觉的原始模型是解决一切视觉问题的完美参照系‘〕因此在简要分析景物成像的基础上应正确认识其视觉感知原理以下将从物理反射特性神经生理学和视觉心理学等角度对图像性质加以分析物理反射特性人眼视网膜上形成的物像是因自然界中物体的反射光所致对其物理特性进行分析重要的就是建立起景物成像的反射率概念假定入射光投射到某种媒质表面的辐射通量为中的一部分辐射通量义为户中,中其。,将被表面反射出去另一部分则通过透射而被媒质吸收反射率。定中反射率尸主要取决于媒质的种类也与表面状态分界面类型温度和人射方向有关并随人射辐射波长及偏振状态而变化若人射光的全辐射通量,一,人“‘“为人射光波长,根据光谱反射率可求得反射的全辐射通量导出全反射率与光谱反射率的关系一,,‘,一。“,,孟“,之只要将上式中的积分限由一换成入,一入即可定义为在光谱波段,入一入之间的相应物理量反射的种类按反射辐射通量的分布形状分为定向反射散射反射和混合反射三种一般的目标其表面都趋于散射反射的漫反射物像的本质是源于自然界中形形色色的物体媒质不同的反射率所呈现的差异性才构成了千姿百态的万象世界神经生理学生物视觉神经系统的每个神经元能相互抑制周围神经元对光照的感受这种现象称为侧抑制现已证明是神经系统的一种普遍现象’〕侧抑制在视觉系统中具有突出边缘轮廓提高视觉反差的功效对比感知是生物视觉的显著特征之一视景中相分离的单个物体通过背景的衬托即在侧抑制的作用下被凸显出来从而易于感知和发现扩散和集中是脑的高级活动的基本规律扩散的主要作用有两个一是使扩散区域内神经元的状态趋于均匀分布即视觉系统具有区域填充作用二是发现区域的拓扑连通性和轮廓的封闭性发现连通关系是视场信息理解的重要基础对轮廓敏感的扩散过程加上轮廓的阻挡机制是区分目标与背景的主要手段视觉心理学的研究发现也构成了扩散神经模式的心理学证据集中的作用也有两个一是突出感兴趣的区域如注视点的区域目标亮度和颜色存在着扩散行为这二是抑制无关的区域如背景集中过程使背景区域内神经元的膜势向感兴趣的目标区域转移这样既歌颂“了目标同时又镇压了背景背景对于目标的呈现起着衬托作用’〕视觉心理学视觉过程中有关认知规律的问题属于心理学的研究范畴图像分割在认知心理学中有一个与之密切相关的内容—知觉组织它是格式塔心理学‘」中一个重要组成部分格式塔增刊景晓军等图像智能化的目标检测技术工—目标背景视觉模型心理学原理认为每一种心理现象都是一个格式塔或完形是一个被分离的整体整体并不等于部分的简单相加也不是各个部分的简单组合知觉是按照一定的规律形式组织起来的整体先于部分而存在并制约着部分的性质和意义人类视觉往往能把图像中空间散布的小点看成连贯的线条或区域这些又很可能是物体的某一边缘或表面具有一定的模式特征人们就是利用视觉这种特有的聚合模式能力进而发现物体形状的从格式塔心理学研究开始人们逐渐认识到图像的局部特征如边缘位置视差长度方向对比度等在知觉上是模糊的但是将这些局部特征综合起来就能使知觉到的图形与背景变得清晰可辨人们观察一幅图像时大脑能够迅速地将图像中若干不同类型的局部模糊信息综合起来形成一个整体性的不模糊的视觉映象格式塔心理学的组织原则和图形规律主要包括背景②接近性国际图像界理论权威个方面①图形和③相似性④连续性⑤封闭性认为图像分割的视觉神经元建模实现与格式塔心理个基本度量①连续性学知觉组织原理具有某些必然的联系并将这些概念进一步简化为②接近性③封闭性以作为图像分割效果的评判指标叫等人对蝇的视觉系统进行了大量研究〔‘。提出了整体信息是运动检测的重要依据目标与背景具有相同的空间结构参数如质地反差亮度和颜色等平且静止或同步运动那么目标将消失在背景之中而不会被感知并处于相同的深度水视脑同步化整合视脑信息的同步化响应〔‘’‘,〕表明图像特征趋向于合成一体并形成各自规整的物体表象其相邻性连续性和共同走势等都反映了物体总是由整体上相近的特征所组成视觉过程有着良好的整体信息处理功能局部信息是零碎和残缺的表现为无序和杂乱无章从认知的观点分析则没有头绪而难于理解整体信息是完整而有序的具有明确的景象意义有利于局域性物体图形的凸现和辨识景物成像描述人类视觉现象是物理光学生理反应和心理活动等诸多因素的集中反映视觉神经生理学的一系列研究为视觉模型的研究提供了良好的研究氛围和可靠的理论依据视觉感知模型人眼是一个具有特殊感知功能的光学系统人眼光学系统的简化模型如图所示一仁卜笼二卜心一一黑袒袅绪靠星爵可饱和的刁图简化的光学处理模型设输人图像景象为二维函数数式妇经光学系统处理后的输出图像目标为二维函来表示即则光学系统对刃的处理作用可以用一种特定的运算符夕〔夕中〔代表视觉感知中的线性和非线性综合运算这里主要研究一个冲激信号通过北京邮电大学学报第卷该光学系统所引起的变化反应冲激函数经光学系统后成像为散函数。。月它也被称做点扩对于线性系统占人二。夕。召只与入夕有关而与位移川无关亦即冲激函数妇无论平移到何位置川上其成像结果都是相同的在上述条件下可定义二维冲激函数夕占二占夕。原来的图像是光强为二占一。川的冲激函数和一月的卷积运算妇几丁一、一月,“经光学系统成像处理后一犷“,·月,,一、「,,卜丁。一。,一,“「式中若冲激函数成像处理后为川这时的点扩散函数是一月,一、〕·、月的函数称为位移可变空间可变点扩散函数相当于时变扩散函数如果研究的光学系统具有位移不变的特性时则认为二夕。月。占二一夕一即占这时二无论位于空间何处其扩散函数都是相同的有夕月二一夕一月工£,卜几丁丁一、一,,“式中为卷积运算符号则二等于原图像一二一,,·月一,,,·“£,,,与点扩散函数二的卷积记‘且北且二其中且为傅里叶正反变换对符号为二维频域变量光学系统的调制转移函数二为二二医学临床测试上通常让人眼观看两张带有正弦光栅的幻灯片其中一张的对比度和空间频率都固定不变以作为参考光栅另一张的对比度则是可变的其可变对比度图像的频率与参考图有所不同将观测结果记录下来即为由式对不同频率的响应特性可用以表征位移不变光学系统的变换作用按照可以看出二或光学系统考虑人眼的视觉模型可分为两大部分如图过程输人为光照形式下的景象测试发现〔”〕人眼的空间频率特性所示系统前端是人眼的视觉成像二几输出为亮度图像妇通过生物视觉的研究呈现为一个低通滤波器而视敏函数光谱响应表明了人眼对不同波长人射光的敏感程度其响应曲线视锥和视杆细胞劝呈带通状如图所示穿透两级功能模块即经过空间频率和光谱响应的双重滤波后的入射光便直接送人视网膜感光器视网膜在光照刺激下由感光器产生反应并转化为神经脉冲然后传输至人通过脑皮层的对比感知和横向抑制侧抑制作用才最终眼视觉模型的第二部分信息处理知觉到并形成了最终的目标映象图中视觉成像部分的个模块说明人眼首先是一个光学成像系统其特点是空间频来表征这种低通特性是由光学系统有限的透镜孔径像率的低通响应特性用函数增刊景晓军等图像智能化的目标检测技术—目标背景视觉模型差和感光器结构共同决定的说明了人眼的空间分辨能力是十分有限的第个模块融人了人眼屈光系统的调焦功能和瞳孔反应的自适应调节机制其感光响应具有明显的对数特性正因‘化范围其中瞳孔直径的伸缩变化可为如此人眼才形成了适应环境光亮高达少的动态麦使进人眼球的相对光量改变约的明暗适应机制完成的倍而更大范围的视环境亮度变化“还主要是靠视网膜计算机视觉就是要研究图中的第二部分人类视觉的显著特征之一就是对比感知其核心是强调了整体背景的支撑衬托作用其次才突出并体现了图形目标的视觉反差视觉成像信息处理空间频率率响应光谱谱响应找凡感光器器光电转换换【对匕感知尸少横向抑制制戈视觉感知模型杜图鼠应巨凡。犷功能模块响应曲线图人眼的视觉系统模型视觉对比灵敏度视觉明暗对比的感知分辨是视觉系统最重要的功能之一在一均匀亮度背景光加一刺激光亮△的目标实际光亮一妇从曰讼﹄…公卜一冲﹁程图义奎、中央附十△如图所示人几人眼的对比灵敏度测试曲线测定视觉刚好能分辨中央和背景亮度差别或引起一定大小生理反应的增量果表明△实验结△二定律△能够察觉的最小亮度差会增大视觉生理学上称△与背景强度成正比即常数度如图所示该结论在的广泛范围人的正常视觉范围内有效而当背景很暗或很亮时比值△为辨差阂其倒数为对比灵敏定律说明视觉系统有一种机制对不同的背景光强均可得到最佳的对比这在神经生理上意味着眼睛能调节其传送给大脑视区的信号近年来研究发现人眼视觉的非线性亮度感知特性用川即视觉亮度误差定律建立的模型表征将更为简洁有效〔北京邮电大学学报泛叨第卷可表示为凌,二、‘‘,、二一、〕‘‘定律阐明了人眼视觉的局限性有些模糊不清或人眼难以辨认的弱目标并非△因目标与背景之间缺乏亮度反差限度以下△而是因反差量甚小△且在人眼的视觉感知所致但对于机器视觉系统来说则不然因为它并未受到的视觉对比感知功能模块可以得到定律的限制有可能将这一弱目标从昏暗模糊的视场环境中发掘出来由图定律揭示了视觉目标是相对于背景视觉反差而显现出来的表象机理目标背景特征表达图像的基本特征就是景物间不同明暗变化的有机组合视网膜上生成的原始表象也是感光器所检测到的光照强度阵列值设给定一幅背景图像、‘〕因此可对图像的目标背景表示模型描述如下二二、二‘尸里,、二二任其中二为像点矢量二二为背景图像函数同时给定一幅目标图像二,二任尸一二任其中为目标图像函数如果将目标放置于背景视场中则会产生如下的景象特征尸尸日尸自尸二尸中而尸里尸尸自中尸尸了均是连通域二任尸二综合生成的视景图像函数为上述特征表明目标月工夕工七尸移人视场尸后将遮挡覆盖视景中的部分景象被遮挡的的物理反射特如果将目标域尸尸区域正好就是目标的支持域尸因此这时区域尸上的图像函数应由目标性所决定即为上的图像二而视景之中除去目标外所保留的区域则为尸、称为前景那么视景尸、上的图像也就自然称做背景目标域与背景域尸说的并集构成了整个视场尸特征强调目标域尸与背景域尸是不重叠的或者个像素不能同时属于个区域特征指出目标图像具有特定的性质如形状结构特性函数分布规律等而背景图像则与之不符特征说明不仅背景是连通的而且目标也具有特征反映了最终的视景图像将由目视景图「且尸拓扑连通性和独特的规整性成为视觉感知的主体标域和背景域上的两部分景象镶嵌而成其图像函数在空间上的分布已将两者的变化特性融人其中这一客观表象的实质就已经向人们展示了一种表征图像函数的视觉模型像」中二二背景图像〕〔二目标图像〕仁任尸二在背景域上且尸任尸中不存在目标像同样在目标域上不存在背景像这一视觉表示模型说明视场中的目标图像和背景图像相互叠加目标的显现是通过二者之间的亮度视觉反差体现出来分析和探讨计算机视觉研究具有双重意义一是借助生物视觉的成果研制设计具有类似人眼感知的智能机器视觉系统二是用物化的机器视觉系统的计算模型来研究人类视觉的识别机理及其增刊景晓军等图像智能化的目标检测技术—‘目标背景视觉模型活动规律当前计算机视觉研究中存在着一些严重问题〔〕其原因是机器视觉的计算模型在理论层次及结构体系上与人类视觉存在着巨大的差异科学研究的实践证明在生物智能的基本原理尚未阐明或尚未转化成实际技术之前它的工程实现是不完善的本文通过物理光学神经生理学和视觉心理学的研究和分析阐明了一种视觉计算模型图像中的目标而展开研究有所不同其操作处理的首要对象是图像背景而非目标本身通过—目标背景表征模型利用其进行目标检测本文的方法与传统的图像处理方法直接针对自适应的背景抑制将突出的图像目标提取出来这是一种间接的变换求解方式与人类视觉感知原理相吻合图像目标检测的具体方法处理过程和实验分析等详见本系列文章的第和第部分参考文献仁划马颂德张正友计算机视觉〕陈国良王熙法等遗传算法及其应用—计算理论与算法基础仁〕北京科学出版社北京人民邮电出版社〕」孟祥武张玉洁基于群体列突变遗传算法的遍历性北京邮电大学学报〔」【【」郭雷〔」〔仁」赵松年杨雄里视觉的神经机制〕上海上海科学技术出版社〔」郭宝龙视觉神经系统与分布式推理理论仁〕西安西安电子科技大学出版社章毓晋寿天德图像分割「〕北京科学出版社视觉信息处理的脑机制〕上海上海科技教育出版社」熊小芸姚国正同步化响应视脑信息处理的新发展〕科学通报【〕容观澳计算机图象处理马颂德北京清华大学出版社〔〕郭爱克齐翔林视觉信息的群体动态时空编码和选择性注意机制【〕国家自然科学基金年重点项目简介〔〕北京科学出版社

因篇幅问题不能全部显示,请点此查看更多更全内容

Top