关于 Oracle 11g Release 1 (11.1) Oracle Text 应用程序开发


本文内容

  • 介绍
  • 文档集合应用程序
  • 目录信息应用程序
  • 文档分类应用程序
  • XML 搜索应用程序
  • 总结
  • 参考资料  

介绍

Oracle 全文检索可以建立文本查询应用程序和文档分类应用程序。它提供索引、文字和主题搜索,以及文档浏览功能。

设计一个 Oracle 全文检索应用程序,先要确定你想执行什么样的查询,以便选择最合适的索引。

因此,利用 Oracle 全文检索,我们建立以下三种应用程序:

  • 文档集合应用程序
  • 目录信息应用程序
  • 文档分类应用程序

 

文档收集应用程序

“文本查询应用程序”可以使用户搜索文档集合,例如,一个 Web 站点,数字图书馆,或是文档仓库。该文档集合通常是静态的,当初始建立索引后,内容没有显著的变化。文档可以任意大小、任意格式的 HTML、PDF 和 MS Word 文档。这些文档存储在表中。通过索引来搜索。

通常,查询由字或词组组成。用户可以通过例如 OR 和 AND,指定文字和词组的逻辑关系。其他查询运算符,如词干(stemming)、接近搜索(proximity searching)和通配符(wildcarding),用于改进搜索结果。

这种类型应用程序的一个重要因素是,搜索到相关的文档,也要尽可能搜索相关性小的文档。最相关的文档必须被排在结果列表中。

CONTEXT 索引为这种类型的应用程序提供最好的支持。若搜索该索引,在 SELECT 语句的 WHERE 子句使用 CONTAINS 运算符。

ccapp014图1 文本查询应用程序

在文档集合上,一个典型的文本查询应用程序让用户输入一个查询。应用程序进入 CONTAINS 查询,并返回满足查询的一个列表,称为“命中列表(hitlist)”。结果通常按相关性排列。应用程序可以使用户在命中列表中浏览一个或多个文档。

例如,一个应用程序在 WWW 为 URLs(HTML 文件)建立索引,通过索引集,提供查询功能。应用程序查询返回的命中列表是由用户可访问的 URLs 组成。

下图说明对于一个在线电子商店,文本搜索应用程序的流程:

  1. 用户输入一个查询。
  2. 应用程序运行一个 CONTAINS 查询。
  3. 应用程序实现一个 命中列表。
  4. 用户从命中列表选择文档。
  5. 应用程序为用户显示要浏览的文档。

ccapp015

图2 文本搜索应用程序流程 

  • 1
  • 2
  • 3
  • 4
  • 下一页

相关内容

    暂无相关文章