1 简介
1 案例背景视觉通道是人类感知外部世界的主要入口,图像则是多维度信息最直接的表现方式,更有“一图值千金”的谚语。但是,图像往往包含较多的信息量,文本方式很难表达其全面内容,因此对图像信息进行检索很难进行抽象建模。此外,随着互联网信息技术的发展,如何有效地存储、检索海量图像数据也越来越引起人们的关注。因此,通过有效构建图像数据库,搭建图像检索引擎,高效地利用图像的关键数据信息,结合已有的搜索技术来实现海量图像的智能检索系统具有重要的现实意义。目前许多主流的搜索引擎均提供了图像搜索通道,如谷歌相似图搜索、百度识图等。搜索图像时不仅可以根据与图像相关联的文字信息来搜索,而且能够按照图像内容本身来搜索,具有很高的使用价值。本案例介绍了基于内容的图像检索的基本知识,但主要研究的是基于形状的图像检索技术,通过提取图像特征并进行建库来进行智能检索。本案例选择以图像Hu不变矩特征为标准来进行图像检索,其基本步骤为:首先,对待检索图像利用边缘检测算子进行边缘检测;其次,利用Hu的7个不变矩作为形状特征向量;再次,进行图像的相似度匹配;最后, 在图像库中检索出最相近的Top 10图像序列作为检索结果。实验结果表明, 使用该算法可以有效地检索出相似的图像,具有一定的使用价值。
2 理论基础随着人们对多媒体信息检索需求的不断增加,传统的基于人工注解的图像检索系统无法实现灵活、高效、准确的图像检索,已远远不能满足人们的需求。为此,研究者们提出了基于内容的图像检索(Content-based Imagine Retrieval, CBIR) , 该方法有效利用了图像自身特征并参考某些模式识别技术来进行高效能图像检索,其基本思路是:将图像的可视特征如颜色特征、纹理结构、边缘轮廓、位置关系等作为图像内容来进行匹配查找,利用已有的模式识别算法进行相似度计算,实现目标检索。其中,图像特征抽取和匹配完全可以借助于数字图像处理技术自动完成,节省了人工成本,提高了执行效率。图像变换在离散数据的条件下往往是不连续的,除平移变换外,旋转和尺度等变换均会导致图像的像素数目变化,从而使计算结果产生误差,而基于不变矩的形状描述可以在一定程度上保存原有的形状信息,具有稳定性,因此可以选择不变矩作为特征进行图像检索。在实际处理过程中,图像的大小可能会影响不变矩特征值,所以在进行图像相似性匹配之前应将图像库中的图像进行尺寸统一化操作,建立标准的图像库。以一幅彩色RGB图像为例, 计算其Hu不变矩特征量的过程为:首先, 将一幅彩色RGB的图像转换为灰度图像,对其进行二值化;然后,归一化二值图像的尺寸,提取边缘图像:最后,统一计算其Hu不变矩。其中,在得到二值边缘图像后,就可以利用不变矩的公式提取不变矩,组成特征向量。在实际处理过程中,考虑到图像库不变矩的计算复杂度较高,因此可以预先执行建库算法,提取其7个Hu不变矩特征,存放于图像的形状特征索引库中,将其提供给图像检索流程来执行图像查询,返回检索结果排序。其中,计算图像Hu不变矩并建库的过程如下所述。(1)边缘图像确定边缘提取算子对图像进行边缘提取,得到边缘图像。(2)提取轮廓确定边缘图像,并进行轮廓跟踪,得到外轮廓图像。(3)细化轮廓确定外轮廓图像,并进行预处理:首先,平滑轮廓得到连续的轮廓线,采用自适应二值化的方法二值化该轮廓线:然后,轮廓线细化操作:最后,提取连续平滑、单像素、二值化的外轮廓图像。(4)目标区域确定经过细化的外轮廓图像,并进行种子填充,获取图像的外轮廓线所包围的目标区域作为输入图像。(5)不变矩计算确定目标区域图像,并计算目标区域的7个Hu不变矩,将其构造成这幅图像的形状特征向量。(6)归一化确定形状特征向量,并对其进行内部归一化处理,将特征值存入图像特征库。
3 程序实现3.1 图像预处理图像预处理主要包括图像灰度化、二值化操作,为后续的不变矩计算提供了图像数据。本案例采用MATLAB库函数rbg2gray进行图像灰度化操作, 采用im2bw进行图像二值化操作。
3.2 计算不变矩根据图像不变矩计算公式,可直接将图像视为数据矩阵进行计算。
3.3 图像检索图像不变矩计算完毕后,就需要根据其特征数据进行图像检索。本案例对图像数据库进行特征计算、对比特征值向量、计算相关度来进行检索。
3.4 结果分析图像检索完毕后,对检索结果根据其相关度排序并进行显示。通过实验可以看出,选择Hu不变矩作为特征来进行图像检索具有执行效率高、检索结果有效的特点。对于不同的图像,经过一系列的预处理流程,计算其Hu特征向量,再与原图像库数据进行比较, 提取To pl 0结果图像作为输出, 能在一定程度上反映图像检索的流程,具有一定的使用价值。
2 部分代码
1 案例背景视觉通道是人类感知外部世界的主要入口,图像则是多维度信息最直接的表现方式,更有“一图值千金”的谚语。但是,图像往往包含较多的信息量,文本方式很难表达其全面内容,因此对图像信息进行检索很难进行抽象建模。此外,随着互联网信息技术的发展,如何有效地存储、检索海量图像数据也越来越引起人们的关注。因此,通过有效构建图像数据库,搭建图像检索引擎,高效地利用图像的关键数据信息,结合已有的搜索技术来实现海量图像的智能检索系统具有重要的现实意义。目前许多主流的搜索引擎均提供了图像搜索通道,如谷歌相似图搜索、百度识图等。搜索图像时不仅可以根据与图像相关联的文字信息来搜索,而且能够按照图像内容本身来搜索,具有很高的使用价值。本案例介绍了基于内容的图像检索的基本知识,但主要研究的是基于形状的图像检索技术,通过提取图像特征并进行建库来进行智能检索。本案例选择以图像Hu不变矩特征为标准来进行图像检索,其基本步骤为:首先,对待检索图像利用边缘检测算子进行边缘检测;其次,利用Hu的7个不变矩作为形状特征向量;再次,进行图像的相似度匹配;最后, 在图像库中检索出最相近的Top 10图像序列作为检索结果。实验结果表明, 使用该算法可以有效地检索出相似的图像,具有一定的使用价值。
2 理论基础随着人们对多媒体信息检索需求的不断增加,传统的基于人工注解的图像检索系统无法实现灵活、高效、准确的图像检索,已远远不能满足人们的需求。为此,研究者们提出了基于内容的图像检索(Content-based Imagine Retrieval, CBIR) , 该方法有效利用了图像自身特征并参考某些模式识别技术来进行高效能图像检索,其基本思路是:将图像的可视特征如颜色特征、纹理结构、边缘轮廓、位置关系等作为图像内容来进行匹配查找,利用已有的模式识别算法进行相似度计算,实现目标检索。其中,图像特征抽取和匹配完全可以借助于数字图像处理技术自动完成,节省了人工成本,提高了执行效率。图像变换在离散数据的条件下往往是不连续的,除平移变换外,旋转和尺度等变换均会导致图像的像素数目变化,从而使计算结果产生误差,而基于不变矩的形状描述可以在一定程度上保存原有的形状信息,具有稳定性,因此可以选择不变矩作为特征进行图像检索。在实际处理过程中,图像的大小可能会影响不变矩特征值,所以在进行图像相似性匹配之前应将图像库中的图像进行尺寸统一化操作,建立标准的图像库。以一幅彩色RGB图像为例, 计算其Hu不变矩特征量的过程为:首先, 将一幅彩色RGB的图像转换为灰度图像,对其进行二值化;然后,归一化二值图像的尺寸,提取边缘图像:最后,统一计算其Hu不变矩。其中,在得到二值边缘图像后,就可以利用不变矩的公式提取不变矩,组成特征向量。在实际处理过程中,考虑到图像库不变矩的计算复杂度较高,因此可以预先执行建库算法,提取其7个Hu不变矩特征,存放于图像的形状特征索引库中,将其提供给图像检索流程来执行图像查询,返回检索结果排序。其中,计算图像Hu不变矩并建库的过程如下所述。(1)边缘图像确定边缘提取算子对图像进行边缘提取,得到边缘图像。(2)提取轮廓确定边缘图像,并进行轮廓跟踪,得到外轮廓图像。(3)细化轮廓确定外轮廓图像,并进行预处理:首先,平滑轮廓得到连续的轮廓线,采用自适应二值化的方法二值化该轮廓线:然后,轮廓线细化操作:最后,提取连续平滑、单像素、二值化的外轮廓图像。(4)目标区域确定经过细化的外轮廓图像,并进行种子填充,获取图像的外轮廓线所包围的目标区域作为输入图像。(5)不变矩计算确定目标区域图像,并计算目标区域的7个Hu不变矩,将其构造成这幅图像的形状特征向量。(6)归一化确定形状特征向量,并对其进行内部归一化处理,将特征值存入图像特征库。
3 程序实现3.1 图像预处理图像预处理主要包括图像灰度化、二值化操作,为后续的不变矩计算提供了图像数据。本案例采用MATLAB库函数rbg2gray进行图像灰度化操作, 采用im2bw进行图像二值化操作。
3.2 计算不变矩根据图像不变矩计算公式,可直接将图像视为数据矩阵进行计算。
3.3 图像检索图像不变矩计算完毕后,就需要根据其特征数据进行图像检索。本案例对图像数据库进行特征计算、对比特征值向量、计算相关度来进行检索。
3.4 结果分析图像检索完毕后,对检索结果根据其相关度排序并进行显示。通过实验可以看出,选择Hu不变矩作为特征来进行图像检索具有执行效率高、检索结果有效的特点。对于不同的图像,经过一系列的预处理流程,计算其Hu特征向量,再与原图像库数据进行比较, 提取To pl 0结果图像作为输出, 能在一定程度上反映图像检索的流程,具有一定的使用价值。
3 仿真结果
4 参考文献
[1]许宏宇, 刘天生, 窦雪. 基于改进的Hu不变矩的图像检索技术研究[J]. 电子世界, 2014(15):1.