芜湖论坛's Archiver

本色 发表于 2007-6-5 22:41

Internet上的图像检索技术(一)

随着网上图像信息的急剧膨胀,对这一部分信息的检索给传统的检索理论带来了挑战。由于图像不同于文本,文本本身就可以说明所讲的内容,而图像则需要靠人们各自的理解来说明其蕴义,因此图像检索比起文本的查询和匹配要困难得多。 {!m)xb]0i^F2j
1f!e YB qNPL
  目前,网上图像信息的检索技术大致可分为两大部分,一是基于整个网络的图像搜索引擎的检索技术,再就是主要基于图像数据库的各种图像检索系统。二者从不同的角度出发检索图像信息。比较而言,后者的技术更为成熟,前者由于要求反映信息快速、全面、覆盖面广,因而技术相对粗糙些。并且前者越来越倾向于与后者的检索技术相结合。
I0S+P5C'R A 一. 图像搜索引擎的检索技术
:w&O6_ f{RY o/PJ N/|)@^
  近年来随着用户对网上图像搜索要求的不断增长,各种基于Web的图像搜索引擎应运而生,它们各自以不同的工作方式为用户提供各种检索途径,使网上图像信息的搜索变得非常简单,尽管还不很完善,却已经可以满足用户的大多数要求。0S-`0{yI \

B kic(Md.n2D6?Z x   1. 工作原理
x*l!ZsB5`}^{$k
Rd-b&\8p   WWW图像搜索引擎需要为在web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索[1]。 l%~CEDDuW
图像搜索引擎主要通过以下两种方法识别图像[2]: (1)自动查找图像文件 可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示"显示下面的图像文件",导向的是嵌入式图像;而HREF则表示"下面是一个链接",导向的是被链接的图像。搜索引擎通过检查文件扩展名来判断其导向的是否是图像文件。如果文件扩展名是.GIF或.JPG,即是一个可显示的图像。(2)人工干预找出图像并进行分类 由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制处理图像的数量。 9} i;mB6D7Lm1?
hfD su6t
. 图像搜索引擎的检索途径
noi7Y lg
Xk&I^U"s;uzL   目前图像搜索引擎大多支持关键词搜索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。主要的检索途径有以下三种:
DJH;q`#A#W
!^?{H6H?&INQ   (1) 关键词检索@7K]y8z:g;^

G{1Tf m#IM5t   即基于图像外部信息或人工赋予的关键词进行自由词检索。图像的外部信息包括图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息。基于这部分信息的检索是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。也可以通过查看图像的标题来匹配检索词,但嵌入式或被链接的图像可能有也可能没有正规标题,即使存在正规标题,可能还是缺少让搜索引擎可识别的一致性标志,如带冒号的"photo"一类的词。但HTML的ALT标签可以起到图像标题的作用,它紧跟在IMG SRC标签后面。也可以查找网站或页面的标题,但这取决于其是否准确描述了该站点的内容,而这几乎是不可能的,所以只是偶尔起作用[2]。
oe lR*z 有些图像搜索引擎采用人工对图像的内容(如物体、背景、构成、颜色等)进行描述并分类,给出标引词,检索时,主要在这些标引词中搜索用户的检索词。这种查询方式比较准确,可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。X+wN:E2hb1K u
&B3|W2N)v{ e
  (2) 分类目录浏览方式
KW)nsc,nw&]
YW*W k!P.v ]bF   图像搜索引擎将采集到的图像或通过某种自动机制或采用人工进行分类标引,为用户提供按主题浏览的检索方式。适用于检索目标不明确或以一般浏览为目的的用户。如WebSEEK提供了含有16个大类77个小类的极为丰富的类目体系,Yahoo!的Image Surfer的类目体系虽只包括几个流行主题,但对类目的划分比较深入,含有6个大类14个二级类以及更多的三级类,每个类目下的图像从几个到几百个不等。y@0WhcQeA;i
(3) 基于图像可视属性的检索/L%Y _#Jh
L4hx@a&Ka
  又称为基于图像内容(content-based)的检索。由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像固有属性的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索),产生的结果也比较准确。目前这种较成熟的检索技术主要应用于图像数据库的检索,在基于web的图像搜索引擎中应用这种检索技术虽还具有一定的困难,但已有部分图像搜索引擎进行了尝试,如Yahoo、WebSEEK就提供了基于图像的形状或颜色直方图的粗陋的可视检索功能。本文的第二部分将具体讨论这种检索技术在图像检索软件中的应用。 z.Q)t ANfg$w,R
y"]S8L8LM
3. 具代表性的几个图像搜索引擎简介[2]a|:q8|EO

5v0t7kZ&d7W+g [*OF i   (1).Scour([url]http://www.scour.com[/url])[3][4]'K)M7l'{d&p

7r M]:Y)wj4Mr h~   Scour成立于1998年,自称是第一个基于web的多媒体搜索引擎。虽严格讲,它并非是一个图像搜索引擎,但可以将检索限制在图像搜索上。 `!l l*O_T

J9V e+Y8[-|c T5U   它的工作原理是在文件名、路径名或ALT标签中搜索检索词。主要使用关键词检索,可以用"+"或"-"来增加或排除关键词,使用尽可能少的关键词会更有效。在高级检索中,可以将检索结果图像限制在GIF、BMP、JPEG等格式中。检索结果显示简图、图像类型(如GIF、BMP)、图像大小、最后被查找的日期、检索词的匹配数量、标引使用的关键词、成功下载的可靠程度等,并同时给出图像文件的URL和源站点的URL。
B]u#i#aQ2`\ QuI Cz7w"~
  主要缺陷是标引深度不足,查准率较低,但查全率较好。3}!u~2ZBUn+n8s
v/tb.X4~x,tK
  (2).WebSEEK ([url]http://disney.ctr.columbia.edu/webseek/[/url])[5]V-?1T uZw
7@Gf5yJtsY)s
  WebSEEK是由哥伦比亚大学开发的一种实验性系统。采用代理自动搜索可视信息并对其进行分类,目前已分类的图像有66万多幅,形成了一个极富创新性的图像目录,主题分类是它的主要优点。{ CI?A }$VS

Ms/i:jD   WebSEEK的检索途径有三种,一是使用关键词进行自由全文检索,但不支持短语检索;二是利用不同的类目等级进行主题浏览;三是在检出图像的基础上利用其可视属性进一步检索。7a$hAE |$r
其检索结果显示为没有文本的简图及图像大小。单击简图可得到原图。每个简图下面提供三个链接,分别是:"col"-根据该图颜色在检出图像列表中搜索相关图像;"web"-在整个WebSEEK目录中根据该图颜色再次检索相近图像;"his"-通过手动调整该图像的颜色直方图进行另一新的检索。}*H.H0?^*Q+J
FC @wei;[/pY
  (3).Amazing Picture Machine([url]http://www.ncrtec.org/picture.htm[/url])[6]
L"t-Z!^G VMf
0n,Q }xO   这是由NCRTEC组织开发的一个"真正人工建立的完全的关键词式索引"。 Amazing Picture Machine后面的教师负责选择图像丰富的站点,然后对每幅选定的图像内容进行描述,给出关键词。因此它的最大特点就是人工干预,关键词检索是主要的检索手段。
!x:}L0`,z{
UHtU%ny B7|/e   Amazing Picture Machine的搜索结果将显示一个简短的标题、有关图像的说明(如彩色或黑白)、文件的大小、文件类型及象素多少等,但不显示简图。单击该标题可得到原图像,但需由该URL回溯才能找出源站点。$m"@M"IW:{S'u
-|,m2P8`(@L!e_%f.a:rC(q
  由于人工干预检索过程,它的查准率极好,但这也限制了它的查全率。它的检索范围很有限,只包括web上人工选择的部分站点。ae:g ~_)h)^Ny|!e|

U7g+`6Tl   (4).Lycos ([url]http://multimedia.lycos.com/[/url])[7][8]8|]5{^!t pe
/r~)A3c1zfs
  图像搜索是Lycos 的多媒体检索功能之一,其搜索范围包括整个网络和一个内含80,000幅图像的图库供浏览和检索,并划分为主题目录。
Q`J@$wpQu
@mB(e#N$o   Lycos对所收录的图像进行了详尽的内容描述(description),并支持短语检索,从而使其查准率大大提高。它根据文件扩展名识别图像,在描述词、文件名、目录名或ALT字段中查询检索词。结果显示的信息极为丰富,包括简图、图像大小、最后检索日期、图像文件名、图像内容描述词、图像所在页面等。点击简图将得到原图及更多的信息,如著作权人和更多的相关图像。比较而言它的检索效果很好,速度也很快。!e)k1d3{'})fy1C
二. 基于内容特征的图像检索系统
,I7][Ni(CX W|O{ m@C9XO'HA;a
  从上面对图像搜索引擎的讨论中,我们可以看出,图像搜索引擎所实现的图像检索基本上是与文本搜索引擎类似的基于图像内容描述(description-based)的语义层次的匹配(例如通过关键词或自由词、分类目录)。因为许多情况下,用户习惯于通过概念来提交查询。概念查询的一种实现即是基于文本式的描述,用关键词、关键词逻辑组合或自然语言来表达查询的概念,这就是语义层次的匹配。但由于对图像的理解比文本更容易产生歧义,当语词不足以形象和准确地描述视觉感知时,用户就需要利用其所呈现的视觉特性来查询,例如利用颜色、纹理、形状等特征[9]。因此,就出现了基于图像本身固有属性(content-based)匹配的图像检索技术。5p.mLRJ.La:G
1 基于内容的图像检索技术[10]+g zH Zu,\(v-x

)w-_;uQ;F y*Yq8v_   (1) 基于颜色特征的检索
h5IR4W [mBX&S o'G Gr$y4es
  颜色特征是图像最直观而明显的特征,一般采用直方图来描述。颜色直方图是表示图像中颜色分布的一种方法,它的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例,直方图颜色空间中的每一个刻度表示了颜色空间中的一种颜色。采用直方图计算图像间的相似性比较简单,但它不能反映图像中对象的空间特征。n [6N~j"rS
k3a'G+m.M%k/dh
  (2) 基于纹理特征的检索
:R| ` s,k
1U6x!W#|4}*Y   图像可以看成是不同纹理区域的组合,纹理通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量。纹理特征可用来对图像中的空间信息进行一定程度的定量描述。根据纹理特征进行检索主要考虑粗糙性、方向性和对比性三种特征。
%{#I Y$|Xidq
R J,^;q3gevo)_8[   由于纹理描述比较困难,一般对纹理的检索都采用示例查询(Query By Example)方式。用户给出示例的全部或部分区域特征,从而找到类似图像

页: [1]
Google

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.