Internet上的图像检索技术(一)
随着网上图像信息的急剧膨胀,对这一部分信息的检索给传统的检索理论带来了挑战。由于图像不同于文本,文本本身就可以说明所讲的内容,而图像则需要靠人们各自的理解来说明其蕴义,因此图像检索比起文本的查询和匹配要困难得多。 {!m)xb]0i^F2j1f!e YBqN PL
目前,网上图像信息的检索技术大致可分为两大部分,一是基于整个网络的图像搜索引擎的检索技术,再就是主要基于图像数据库的各种图像检索系统。二者从不同的角度出发检索图像信息。比较而言,后者的技术更为成熟,前者由于要求反映信息快速、全面、覆盖面广,因而技术相对粗糙些。并且前者越来越倾向于与后者的检索技术相结合。
一. 图像搜索引擎的检索技术
o/PJ N/|)@^
近年来随着用户对网上图像搜索要求的不断增长,各种基于Web的图像搜索引擎应运而生,它们各自以不同的工作方式为用户提供各种检索途径,使网上图像信息的搜索变得非常简单,尽管还不很完善,却已经可以满足用户的大多数要求。0S-`0{yI\
1. 工作原理
WWW图像搜索引擎需要为在web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索[1]。 l%~CEDDuW
图像搜索引擎主要通过以下两种方法识别图像[2]: (1)自动查找图像文件 可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示"显示下面的图像文件",导向的是嵌入式图像;而HREF则表示"下面是一个链接",导向的是被链接的图像。搜索引擎通过检查文件扩展名来判断其导向的是否是图像文件。如果文件扩展名是.GIF或.JPG,即是一个可显示的图像。(2)人工干预找出图像并进行分类 由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制处理图像的数量。 9} i;mB6D7Lm1?
hfD su6t
. 图像搜索引擎的检索途径
目前图像搜索引擎大多支持关键词搜索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。主要的检索途径有以下三种: