芜湖论坛's Archiver

本色 发表于 2007-6-5 22:44

Internet上的图像检索技术(二)

(3) 基于形状特征的检索
(Iz6O.[;q.w!mb 3x~y6i`6r+gE7H
  采用该特征进行检索时,用户通过勾勒图像的形状或轮廓,从图像库中检出形状类似的图像。基于此特征的检索方法有两种:(1)分割图像经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索。(2)直接针对图形寻找适当的矢量特征用于检索算法。但处理这种结构化检索更为复杂,需做更多的预处理。(b,_s4C2L^

"@)Hi0C8a   2 基于内容特征的图像库检索引擎[11]
K3Usy aG
F;Jw6s)NWSekW1H   目前已有Virage、Excalibur和IBM公司开发出了基于图像内容相似性特征的图像库检索引擎,并在网上提供了演示站点。a8@%rj3a6Y+F

5p8lE8fD&E$q!y   (1) VIRAGE([url]http://www.virage.com[/url])H*Y[X-k+u9M0Qz

6^X3Y#IM|.D,} J   VIRAGE公司的VIR(Visual Information Retrieval)图像引擎提供了四种可视属性检索(颜色、成分、纹理和形状)。每种属性被赋予0到10的权值。通过颜色特性检索是最简单明了的,该软件对选出的基础图像的色调、色彩以及饱合度进行分析,然后在图像库中查找与这些颜色属性最接近的图像。成分(composition)特性指相关颜色区域的近似程度。RRZ [7i{

s5kmq2~ iZa"g-K   用户可以设定一个或多个属性权值来优化检索。要达到最佳平衡度需要反复试验,但检索过程是相当快的。在结果显示矩阵中可以选择查看3、6、9、12、15或18个简图。通过对四个属性权值的调整,显示出不同的检索结果。简图是根据相似度降序排列。点击简图标题将得到该图像的一些详细说明,包括Virage计算出的相似比。
Ws+e2@w5mH&G (2) EXCALIBUR([url]http://www.excalib.com[/url])
*jrl fYBX.^
3{&aY3R(i^s*t^   Visual RetrievalWare只是Excalbur提供的查询程序之一。在它的演示站点中提供了对其检索参数的综合设置的测试。Excalbur提供基于6种图像属性的检索,分别是颜色、形状、纹理、颜色结构、亮度结构和纵横比。颜色属性是对图像的颜色及其所占的比率进行测定,但并不包括对颜色的结构或位置的测定,这一项是由颜色结构属性控制的;形状属性指图像中物体的轮廓或线条的相对方位、弯曲度及对比度;纹理属性是指图像的平滑度或粗糙度,一幅图的表面特性;亮度属性是指构成图像的象素组合的亮度。这是一个非常有力的图像检索工具。
S4T qlY:[]e.B #P:n5v;X i|;_i
  每一个属性值范围从0到5。例如,主要以形状属性进行检索时,将形状属性的权值设为5,而将其它属性的权值设为0或1。不同的权值设定产生的结果不同。当主要用形状属性检索时,检出的结果可能看起来毫不相干,例如,用一幅意大利地图为示例图像会检出一幅GUCCI的靴子,因为它们的形状的确很相似。应该注意到,图像的形状相似性与该图像中的物体是什么没有关系。
3Rg;I$Y!X FVf9r (3) QBIC([url]http://www.qbic.almaden.ibm.com[/url])[12]dyYwe#n

N/H$_vg){m b   QBIC(Query By Image Content)是由IBM公司著名的Almaden实验室开发的。它可能是目前应用最广的图像检索系统,如旧金山现代艺术博物馆以及法国文化部等机构。e `3?oKu

Z vxK~At-t   虽然QBIC只提供了3 种属性的检索功能:颜色属性、形状属性和纹理属性,但它的检索效率非常高。颜色特性的查询包括颜色百分比查询和颜色分布查询,利用颜色百分比查询,用户可以找到具有相似颜色及比率的图像,而利用颜色分布查询可进一步找到不仅颜色相似且颜色分布也相似的图像。纹理特性是对图像中线条的粗糙性、对比性、方向性三者的综合考虑。形状属性查询包括对象形状查询和轮廓查询。[f[K&s.Q_%|O

W)HL P)d/K6~   QBIC除了上面的基于内容特性的检索,还辅以文本查询手段。例如为旧金山现代艺术博物馆的每幅作品给予标准描述信息:作者、标题、日期,许多作品还有内容的自然描述。Lu5Cbs'F,m
三. 目前图像检索技术研究的热点问题
nUU[3j/FpR &u9S6?1x C"hc,P
  尽管各种图像搜索引擎为快速、大量地查找网上图像信息创造了条件,而基于内容特征的图像库检索技术亦为图像数据的检索从可视角度开辟了一条更为准确直观的途径,但仍存在一些有待研究的热点问题。
i/ih+f7Rhj m4W(a`M0w;E|'L B
  1 两类图像检索技术的结合
jWZy#JEJXdk
\:Z O1TvQx9GH.M   现有的图像搜索引擎主要侧重于对图像内容的语义描述,而图像库检索技术则侧重于图像内容的特征提取,二者虽侧重不同但却互相补充。如果能将二者结合起来取长补短,则网络的图像检索技术必有新的进展。已有的图像搜索引擎在信息的自动加工和标引方面都有待提高,需要开发出计算机自动识别和标引图像的算法和技术,以完善现有的检索功能,并与已有的成熟的图像库检索技术相结合,这是今后应该研究的一个课题。而且,图像库检索技术也应面向网络,利用网络技术进行改造,提供新的WWW访问界面代替原来的应用系统界面。同时将巨大的图像库资源利用网络实现共享。
k!`? g:QA0~ T(O!b9m5}Y 2 对基于内容编码技术的研究J"B,F t#Z)F9u&t

\\1?.{bNu%E)_   目前,国际上还没有通用的基于内容的编码标准。20世纪90年代初,国际上就开始了对基于内容的图像信息检索方面的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,大量原型系统已经推出,其中,部分已投入到实际应用中以检验其有效性。同时,MPEG-7标准作为基于内容的多媒体编码标准也正在制定当中,即将成为国际标准中的一员。因此,应尽快对MPEG-7标准进行研究,分析其编码的实质,在此基础上进一步研究基于内容检索的系统,使我国基于内容的图像检索尽快走向实际应用阶段[9]。
|n"a@"]LDh4E 3 对用户查询接口的研究
4Ck u }*F)tf h
:XC0F7|K2K(QO4y{-Mk   这涉及到用户对图像内容的感知表达、交互方式的设计、用户如何形成并提交查询等方面。现代多媒体信息系统的一个重要特征就是信息获取过程的可交互性,人在系统中是主动的。除了提供示例和描绘查询基本接口之外,用户的查询接口应提供丰富的交互能力,使用户在主动的交互过程中表达对图像语义的感知,调整查询参数及其组合,最终获得满意的查询结果。用户的查询接口应该是直观易用的,底层的特征选择对用户是透明的。这里涉及到如何把用户的查询表达转换为可以执行检索的特征矢量,如何从交互过程中获取用户的内容感知,以便选择合适的检索特征等问题[9]。
"_%E2t;`S Bt'`
[-Omu(r},b   随着网上多媒体的广泛应用,对图像的检索需求将会越来越迫切。未来的图像检索技术将是网络技术和基于内容的图像库检索技术的结合。随着多媒体信息处理技术的日益发展和深化,图像信息的加工、处理和检索标准的出台,网上的图像检索技术将会日趋完善,而图像搜索引擎也将成为Internet上的新宠。

页: [1]
Google

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.