毕业论文

打赏
当前位置: 毕业论文 > 电子通信 >

基于内容的数字图像检索技术的研究(3)

时间:2024-02-14 09:46来源:毕业论文
2 图像特征表示与分析 2。1 颜色特征 论文网 图像和颜色是密切相关的,有了颜色后的图像才更加绚丽多彩,内容信息才更加多种多样。同时,颜色也是十

2 图像特征表示与分析

2。1 颜色特征论文网

图像和颜色是密切相关的,有了颜色后的图像才更加绚丽多彩,内容信息才更加多种多样。同时,颜色也是十分主要的视觉特征,人们会用皮肤的颜色去区分人种,比如说白种人、黄种人和黑种人。上文有提到过,图像的最基本的元素是像素,像素中也都含有颜色信息。颜色是最常用的一种视觉特征,其特征定义十分准确,很提取容易,并且具有旋转不变性等特征,一幅图像,即便拉伸或者缩小,其颜色特征都不会发生改变。

基于内容的图像检索(CBIR)中的一个关键的问题就是分析图像并给出其内容描述。经过对图像像素颜色的属性以及像素间相互的关系进行适当分析,就可以得到数字特征或者描述特征,特征是可以在一定程度上去描述图像本身的内容。之后就可以利用这些特征,对图像建立索引成功达到图像检索的目的。所以图像内容的表示本质上是图像特征提取的问题。图像内容的分析及描述可分为两个层次:一、图像信息的视觉特征,如纹理、颜色、形状和空间关系等,这些特征都属于图像的低层特征。二、人们认知范畴相关图像内容,也就是图像中的内容语义描述,这些都包括于图像的高层语义特征之中。本章节讨论基于低层视觉特征的分析方法,分别从三方面:颜色特征、纹理特征以及形状特征进行分析。还有对空间关系以及高层语义特征进行简单介绍。

2。1。1 颜色模型

十七世纪时,英国物理学家牛顿通过实验验证白光通过三棱镜,结果光被分解成了赤、橙、黄、绿、青、蓝、紫七种颜色,而产生的原因就是不同颜色在棱镜中不同的光的折射率,从而证明普通的光是由七色组成的,是具有不同波长的光组合而成的。随着科学技术的发展,人们渐渐意识到,不同颜色的光其本质上是频率不同的电磁波,人的脑和眼的组合把不相似的频率电磁波可以识别成不同的颜色。在生物学实验中发现,人的视网膜中拥有红、绿、蓝三种颜色的感知,也就是我们通常所说的三原色。三原色波长依次为700mm、546。1mm、435。8mm。

关于如何对图像的颜色信息进行处理以及描述,首先我们要做的是建立与之相对应的颜色表达模型,然后描述出定量。常见的颜色模型有许多,例如RGB、HSV模型等。下面简单介绍下这两类颜色模型。

1。RGB模型

RGB模型是基于笛卡尔坐标系统,3个轴分别为R,G,B,这个颜色空间是如图1所示的立方体。坐标原点对应黑色,距离原点最远的一顶点对应为白色。在RGB模型中,从黑色到白色的灰度值均匀分布在原点到距离原点最远顶点的线上,而不同的颜色由其余剩余的点来与之对应,就可用向量来表示出从原点到该点。在RGB模型中,各种不一样的颜色分布在立方体上或其内部,因而可以用从原点分布的向量进行定义。为了更加清晰明了,我们将所有的颜色值都需要被归一化为单位立方体,这样就可以得到所有的R,G,B的值都在区间[0,1]中。

图1 RGB颜色空间模型

根据RGB模型,任何一幅彩色图像都包括3个相互独立的基色平面,也就是说可分解到3个平面上。如果一幅图可被表示为3个平面,使用RGB模型比较便捷不复杂。比如在对多频谱的卫星图像进行处理时就常用这个模型。但是它也有其不足之处。因为这个空间是颜色表示空间,无法直观地让人通过视觉去感知;其次,RGB空间中两点的欧氏距离(在二维和三维空间中的欧氏距离的就是两点之间的距离)与实际颜色的距离不呈线性,也就极易导致颜色的误分离,有用信息未获取或掺杂无用信息。 基于内容的数字图像检索技术的研究(3):http://www.youerw.com/tongxin/lunwen_201709.html

------分隔线----------------------------
推荐内容