租户个性化定制和元数据驱动技术,元数据驱动


        随着一些SaaS软件逐渐被越来越多的租户使用,租户的个性化定制需求逐渐成为一个SaaS软件实用性和适用性的一个困难。不同租户的需求几乎都是有差异的,每个租户要求定制化他们的应用也是很自然的。传统的SaaS软件模式,无法做到很好的应用隔离,同时由于大多采用传统的二进制代码开发维护方式,也使得个性化定制的支持随着客户定制量的增加会变成一个天文数字的工作量,也使得最终无法支持租户的个性化定制。因而现在SaaS软件面对个性化定制的对策是不支持租户个性化定制或收取昂贵的个性化定制费用,这些都成了SaaS推广使用和快速发展的壁垒。

        元数据驱动技术核心思想主要是通过一个通用的解析执行引擎,解析预先定义的软件系统的元数据并执行,最终形成所需要开发的软件系统的技术。可以看出,元数据驱动技术的使用使得软件开发过程从传统的代码开发过程转为元数据的定义过程。

        元数据(metadata)即描述数据的数据(data aboutdata),软件系统的每个部分包括用户界面、业务逻辑、数据访问、工作流控制、业务权限、报表展示等我们都认为是数据(data),通过抽象分析这些数据,得到一套通用的软件系统的模型,描述一个软件系统的过程就成为元数据定义的过程。

        元数据的定义开发环境可以采用B/S模式在线模式,通过采用在线配置取代传统手工代码编写的软件开发模式,能够实现软件的在线开发和实时发布,在保证系统稳定性和灵活性的基础上极大提高了应用软件的开发效率。

        EEPlat PaaS平台采用了元数据驱动的核心思想,因而应用的个性化定制其实就是租户元数据的个性化定制,通过EEPlat的后台配置环境,元数据个性化的定制工作,只需要点点鼠标就完成,相比传统二进制开发的模式,可以说是一个革命性的颠覆性的创新性变革。

        EEPlat PaaS平台在每个租户的元数据(租户相关模型)和每个租户的业务数据之间都有一个明确的隔离。这些明显的边界使我们可以安全得定制或修改某一个租户的应用而不会影响其它租户。

        基于EEPlat PaaS平台开发自己的SaaS应用,先天性的支持租户的个性化定制,同时具备快速开发部署发布的特性,在面对个性化定制的需求,给SaaS厂商提供了更多的应付手段。




~追加100分帮我完成这些简单的填空问答题

网络检索工具基本类型大致包括五种:搜索引擎、主题目录、检索数据库内容或隐蔽网络、元搜索引擎和门户

1搜索引擎

搜索引擎目前常见网络检索工具具有下特点:a.利用计算机Robot程序构建非人工选择;b.根据主题分类进行组织所有网页都由计算机运算法则排序;c.包含所链接网页全文通过词语匹配找所需网页;d.容量巨大并通常能检索出许多信息要进行复杂检索应选择些允许进行进步检索搜索引擎;e.通常未经过评价反馈结良莠需要用户自己选择
目前互联网上搜索引擎数量众多笔者仅选择其著名几种向读者推荐并进行横向比较
Google具有世界上网页数据库之包括许多其网络文件(例PDF, Word或Excel文件Powerpoint)尽管Blog和Newgroups存许多广告和混乱Google流行评级使值得网页出现搜索结前部Google并包含所有网页检索网页数量Google完全检索交叉研究表明任何搜索引擎数据库网页大约半只存数据库因此获得第二种意见或建议通常有价值对于何获得第二种意见推荐使用Teoma,和Vivisimo(直接搜索三大搜索引擎数据库元搜索引擎), 或Yahoo!Search

2主题目录
主题目录特点:
●人工选择建立——计算机或Robot程序
●主题目录形式每页都按照主题分类进行组织——根据每主题目录范围主题并标准并处于变化之
●从包括所链接网页全文——只能搜索东西(题目描述主题目录等)
●较小并且专业比搜索引擎内容少
●通常经过仔细评价和注释(并定总

3检索数据库内容或隐蔽网
隐蔽网络指搜索引擎找并且少包括主题目录网页见网则指利用些工具看见隐蔽网包括网页见网三倍隐蔽网由吉尔.埃尔斯沃思博士(Dr. Jill Ellsworth)于1994年提出来
会存隐蔽网www网上有许多专业检索数据库从网页上检索框进入UCB图书馆目录pathfinder或其图书馆目录;或些网上检索统计数据库检索所使用词语被送专业数据库网页返回动态产生检索该结自动删除再保存搜索引擎能获取些动态产生网页计算机Robots或Spiders能自己键入产生些网页检索式Spider通过访问们所知道网页上所有链接来发现网页除非某地方存能被Spiders用来重新进行专业数据库检索链接数据库内容对于搜索引擎来说需要密码网页对搜索引擎也关闭Spider能打字(还有些其类型搜索引擎无法包括网页某些文件格式:flash流媒体文件;实时数据;股票价格;天气预报等)目录少包括些网页内容目录由人工建立打字)对目录来说并能包括些链接理由点击些链接每次点击时所动态产生数据库进行检索
推荐利用下两网站来查找网络上检索数据库内容或隐蔽网
●The Invisible Web Directory (www.invisible-web.net):由Gary Price和 Chris Sherman建立经所收录隐蔽网页进行整理主题目录形式提供
● Direct Search (www.freepint.com/gary/direct.htm):罗列并描述了许多学术主题检索数据库由学术研究馆员Gary Price创建

4元搜索引擎
元搜索引擎目前还难有明确定义其工作原理描述元搜索引擎检索框输入关键词元搜索引擎会检索信息同时传递搜索引擎和网页数据库进行结查找几秒钟数据库提供给检索者原搜索引擎并拥有自己网页数据库有些元搜索引擎提供有价值限定条件限制检索能力定制对哪些搜索引擎或目录进行检索工具上时间等种限制类似站式采购观念具吸引力;实施限制了决定哪里采购能力些元搜索引擎彻底多数漏掉了Google(搜索引擎)也经常漏掉Northern Light(对学术研究非常有帮助)并且能利用每搜索引擎高级特点而且何传送复杂检索方面也预测通常预先会知道们会搜索出有些元搜索引擎需要下载安装多数需要
款理想元搜索引擎应该具备下特点和功能:第含盖较多搜索资源随意选择和调用元搜索引擎;其次具备尽能多选择功能资源类型(网站、网页、新闻、软件、FTP、MP3、图像等)选择、返回结数量控制、结时段选择、过滤功能选择等;第三强大检索请求处理功能(支持逻辑匹配检索、短语检索、自语言检索等)和同搜索引擎间检索语法规则、字符转换功能(支持NEAR算符搜索引擎自动实现由NEARAND算符转换等);第四详尽全面检索结信息描述(网页名称、URL、文摘、源搜索引擎、结与用户检索需求相关度等);第五支持多种语言检索
目前有两类智能元搜索引擎(smarter meta-search engines):
●只搜索些较好数据库接受复杂检索集成较好消除重复提供附加特征例检索结按照主题聚类元搜索引擎
●对许多资源进行挖掘工具功能强大帮助用户检索结所需要内容适用于对某主题进行深度探究研究人员

5门户
主题门户与搜索引擎主题门户对信息揭示更专业、更深入;而搜索引擎相对广泛、肤浅某些隐藏网络深网门控网络区域内信息只有主题门户能够揭示能通过搜索引擎直接检索
DESIRE (欧洲研究教育信息服务开发)项目开始于1998年7月结束于2000年6月由欧盟资助于10公共机构内项目合作伙伴间合作改善现有欧洲信息网络项目开发了用于建设信息门户图书馆与其组织手册信息门户(gateway)多种定义DESIRE手册定义:信息门户控制质量信息服务提供与其网站或文件相连链接;预先定义集合内通过人工处理选择资源;人工产生内容描述;用关键词或控术语;用于浏览人工创建结构;对性化资源半手工化地创建元数据种类型信息门户目帮助用户群快速有效地发现高质量相关基于网络信息用于网络发现更加高效种检索工具
Strauss讨论了水平和垂直门户水平门户例子Yahoo-来源极其广泛而检索者用来找网上所要东西内容却大学或图书馆更能建设垂直门户于专门用户群并对群体内同类群进行性化服务像某学科内学生或学者群UCLA人类学网络门户例子垂直门户例子国家科学基金资助国家科学数字图书馆项目
从Strauss观点出发主题门户应该属于垂直门户IMesh期3年项目开始于1999年目地支持主题门户提供者和相关方交流与合作促进主题门户发展提供交换想法和技术开放论坛其重点专门技术交流软件工具和元数据重新利用提供框架IMesh Toolkit项目给出了下面定义:
主题门户围绕特定主题对线资源提供搜索和浏览入口网站主题门户资源描述通常手工创建通过自动程序产生资源款目由手工产生通常优于些从传统网络搜索引擎获得款目
Traugott Koch提出质量控制主题门户应该目前门户发展方向所谓质量控制门户使用整套质量控制机制来支持系统资源发现因特网服务使用相当多地人工来确保所选资源满足质量标准并利用标准元数据对些资源进行详细描述进行定期检查与更新来确保较好资源集合管理主要目标通过使用控词对资源进行索引及对高级搜索和浏览提供深度分类结构来提供高质量主题入口
目前国外已经有了各种主题门户甚至还出现了门户门户Heriot Watt大PINAKES(主题导航簿)门户列表http://www.hw.ac.uk/libWWW/irn/pinakes/pinakes.html及clearinghouse (http://www.clearinghouse.net)我国国家科学数字图书馆目前也正建设我国学科主题门户
主题门户强调特定主题领域主题门户资源限制较小特定目标组同时也正主题门户与主题目录区分开来

智能搜索引擎特征

智能搜索引擎设计追求目标:根据用户请求获得网络资源检索出对用户有价值信息般而言智能搜索引擎有3主要特征:

1.网络蜘蛛智能化

网络蜘蛛通过启发式学习采取有效搜索策略选择佳时机获取从Internet上自动收集、整理信息众所周知信息动态更替无时无刻进行即使搜索过程文档会被添加、删除、改变因此智能引擎有设计网络蜘蛛自动完成线信息索引

搜索引擎能Internet或Intranet任何地方工作能尽能地挖掘和获得信息网络蜘蛛既收集特定站点信息又能遍历整Internet对整Internet进行索引了提高搜索速度智能搜索引擎同时启动多引擎并行工作引擎搜索结整合整体存放数据库

此外智能搜索引擎具有跨平台工作和处理多种混合文档结构能力既能处理HTML(HyperText Markup Language超文本标志语言)又能处理SGML(Standard for General Markup Language通用标志语言标准)和XML(eXtended Marked Language扩展标志语言)文档及其类型文档Word、WPS等

同时智能搜索引擎还具有高召回率和准确率所谓召回率次搜索结符合用户要求数目与和用户查询相关总数之比所谓准确率次搜索结符合用户要求数目与该次搜索结总数之比

智能搜索引擎应该支持多语言搜索允许用户文输入查询英文或其语言信息

2.特定用户提供相关信息

智能搜索引擎能通过观察用户了解用户兴趣爱好另外能通过训练学习增长智能每次用户对引擎返回信息进行评价智能引擎根据用户评价调整自己智能搜索引擎还能对搜索结进行合理解释智能搜索引擎具有主动性任何特定时候(用户关心信息发生了某种变化时候)用各种方法与用户取得联系些方法包括电子邮件、电、传真、寻呼机、移动电搜索引擎还根据用户特定时刻位置信息选择恰当方法跟用户通信

3.搜索引擎人机接口智能化

智能搜索引擎通过自语言和用户交互采取诸语义网络等智能技术通过汉语分词、句法分析及统计理论有效地理解用户请求甚至能体会出用户弦外之音大程度地了解用户需求

智能搜索引擎技术

要想真正实现上所述智能搜索引擎还有大量工作要做种比较实际做法智能技术跟传统搜索引擎结合逐步实现智能化下面搜索引擎向智能化迈进过程采取些技术

布尔逻辑检索
http://gdy.gdmc.edu.cn/library/distanced/luoji.htm

剩下白痴问题自己Google

帮帮我啊!~~~

  internet技术与应用

  基于Internet信息资源发现技术与实现

  王继成 邹 涛 杨小江 潘金贵 张福炎

  摘 要:Internet上大量、异质、分布、动态信息造成了信息过载.信息充斥情况下何有效地用户提供基于Internet资源发现服务已经成项重要而迫切研究课题.搜索引擎部分地解决了资源发现问题而其效却远能使人满意.文首先提出了分布协作式资源发现策略讨论了资源发现服务所涉及几项关键技术包括:多维文档立方体数据模型、Web文档检索、基于Z39.50书目检索及基于Agent用户接口等并给出了相应解决方案.此基础上构造了系统原型RDSCC有效地提高Internet上资源发现质量.
  关键词;资源发现多维文档立方体WebZ39.50Agent
  图法分类号:TP391; TP393

  THE TECHNOLOGY AND IMPLEMENTATION OF RESOURCE
  DISCOVERY ON INTERNET

  WANG Ji-Cheng, ZOU Tao, YANG Xiao-Jiang, PAN Jin-Gui, and ZHANG Fu-Yan
  (State Key Laboratory for Novell Software Technology, Nanjing University, Nanjing 210093)
  (Department of Computer Science and Technology, Nanjing University, Nanjing 210093)

  Abstract A mass of heterogeneous, distributed and dynamic information on Internet has resulted in information overload. With the flood of information, it has become an important research issue to provide users with effective service of resource discovery on Internet. Search engines attempt to solve this problem, yet their effect are far from satisfying. In this paper, a distributed cooperative strategy for resource discovery on Internet is firstly presented. Then, several key technologies involved in resource discovery are studied, including data model, Web document retrieval, bibliographic retrieval based on Z39.50, and agent-based user interface. Finally, a system prototype RDSCC is designed to improve the quality of resource discovery on Internet.
  Key words resource discovery, multi-dimension document cube, Web, Z39.50, agent

  1 引 言

  人们已经进入信息极大丰富时代.方面信息来源广泛包括Web文档、图书文献数字化资料等些异构信息分布Internet空间;另方面信息量巨大.Web文档目前已经拥有3亿页面而且数字仍每4至6月翻速度增加〔1〕.面对信息海洋人们觉得力从心往往花费了多时间却所获甚少.种情况下何有效地提供基于Internet资源发现服务帮助用户从大量信息资源集合与给定查询请求相关、恰当数目资源子集项重要而迫切研究课题.
  传统搜索引擎AltaVistaYahoo等试图解决Internet上资源发现问题.从资源覆盖度、检索精度、检索结视化、维护性等诸多方面来看其效能够令人满意.此外搜索引擎仅提供对Web文档检索缺乏对书目文献等其重要信息资源支持.本文我们针对Internet资源发现现状提出了分布协作式资源发现策略同时讨论了资源发现服务所涉及几项关键技术包括:多维文档立方体数据模型、Web文档检索、基于Z39.50书目检索及基于Agent用户接口等.此基础上我们设计了系统原型RDSCC有效地提高Internet上资源发现质量.

  2 资源发现分布协作策略

  我们注意搜索引擎采用典型方式们试图遍历整Web对其上所有文档生成索引供用户检索.种集方式给Web文档检索带来了些严重弊端主要表现:①覆盖度有限据估计任何搜索引擎索引Web页面都页面总数三分之〔2〕;②维护困难搜索引擎索引数据库更新频率有限往往会产生索引失效〔3〕;③消耗太大包括网络带宽、搜索引擎自身昂贵硬件设施等.元搜索引擎MetaCrawler通过综合多搜索引擎定程度上扩大了覆盖度.元搜索引擎对搜索引擎依赖使无法从根本上解决上述问题.随着信息资源种类和数量急剧增长方式使得上述弊端更恶化.方面需要管理信息资源极其巨大任何式资源发现系统都无法完全满足需求;另方面式资源发现系统各行其重复建设.因此我们认Internet上资源发现应该采取分布协作策略.
  资源发现分布协作策略指按照某种原则对Internet上信息资源空间进行划分若干信息资源子空间.对于每子空间分别建立资源发现系统提供相应资源发现服务.目前分布计算及多Agent系统等领域研究已经取得了丰硕用于集成些自制、异构资源发现系统从而构成Internet上协作检索群体.信息资源空间划分原则按照学科领域按照地理区域等.例我们各种同专业科研人员建立专业领域资源发现系统.用户根据自己需要向相应系统提出请求.采用分布协作资源发现策略资源发现系统所要管理信息资源相对缩小降低消耗便于维护;同时各系统之间通过相互协作扩大了覆盖度.种策略有效地克服集方式提高资源发现服务质量.

  3 资源发现服务关键技术

  资源发现系统开发涉及多领域、多技术复杂工作.其数据模型系统核心Web文档和书目数据系统重要信息来源而用户接口好坏直接决定了系统使用效率.下面我们对几项关键技术分别加讨论给出相应解决方案.
  3.1 数据模型
  管理信息资源而言数据库优于平面式文件系统.因此资源发现系统通常采用文档数据库来存储异构信息资源.文档数据库内部实现般采用半结构化逻辑模型而其外部表现即反映给用户视图则构成了资源发现系统概念模型.例搜索引擎返回给用户通常顺序固定线性列表包含了Web文档标题、URL和摘要.种概念模型用户必须逐地浏览相关文档花费了大量精力.当返回数目众多时(种情况非常普遍)问题更突出.对用户行有关研究表明用户经常希望能够从多角度观察信息资源满足于简单、固定列表.OLAP数据库环境种有力分析工具用户提供了关于数据多维视图〔4〕.虽Web文档等信息资源和数据库有着本质区别我们认OLAP技术对其仍有借鉴之处.下面我们引入多维文档立方体作资源发现系统种新概念模型.
  定义1. 维d指人们观察文档角度.例用户希望从时间、机构等角度来观察文档.用户也常常关心某主题分类文档情况.时间、机构、主题分类等元数据构成了文档维.
  定义2. 多维文档立方体CDocument文档Document文档元数据(维di)分布文档周围从而构成超级立方体(d1, d2,…,dm, Document).
  多维文档立方体上进行各种多维分析操作包括:切片、切块、旋转、上钻、下钻等从而生成多种文档视图使用户能够从多角度观察文档资源各种特征深入了解包含信息内涵.例用户通过切片从文档集合来选择某机构文档子集.该子集按照主题内容来分组主题内按照时间进行排序.用户既通过上钻来折叠视图观察每主题总体特性;也通过下钻来展开视图观察每子主题或每文档具体特性.图1所示.

  图1 文档超立方体与多维文本视图

  除了能够用户提供有效视化手段多维文档立方体上还进行统计分析从而能够揭示文档资源特征分布.例我们比较机构时间关于各主题文档情况从而回答些搜索引擎无法回答问题近年来哪所大学图形图像领域发表文章.
  需要说明上述多维文档立方体和多维文档分析必须建立利用计算机语言学和信息处理技术对文档资源进行预处理基础之上.文档维来自于预处理所得元数据时间、作者、主题等.
  3.2 Web文档检索
  目前Web已经成人们获取信息重要来源. Altavista等搜索引擎检索算法相对简单检索精度有限使得检索Web文档相关性得保证〔3〕.Yahoo通过对Web文档进行分类方便用户浏览和查找分类工作由人工完成大大影响了其处理页面数目(Yahoo! 对Web文档覆盖度远远小于Alta-vista等).我们设计了种新Web文档检索模型包括语料库维护、词典维护、Robot、特征矢量生成器、训练器、分类器等6部分组成图2所示.该模型能够分析用户信息需求自动搜集满足目标特征Web文档供用户查阅.

  图2 Web文档检索模型

  该模型我们采用了常用向量空间模型(vector space modelVSM)〔5〕作用户信息需求和文档特征表示方法.VSM(或每类)文档映射组范化正交词条矢量所张成向量空间点.每用户信息需求或未知文档都表示该向量空间特征矢量(T1,W1;T2,W2;…,Tn,Wn)Ti特征词条项Wi特征词条权值.文档与用户信息需求匹配及文档分类都转化向量空间矢量匹配处理.该模型工作分训练和分类两阶段.
  (1) 训练阶段用户首先建立语料库即给出批代表其信息需求示例文档(每文档被标上类别标识).特征矢量生成器利用词典库(常用词典和专业技术词典)训练文档表示系列特征矢量.训练器对每类训练文档特征矢量进行统计生成代表该类特征矢量.
  (2) 分类阶段Robot模块首先Web文档收集本地.特征矢量生成器本地待分类文档表示系列特征矢量.分类器待分类文档特征矢量与训练器生成类别特征矢量进行相似度匹配文档分类符合相似度阈值条件已分类文档返回给用户.
  经实用表明该模型能够对大量Web文档进行自动、快速地分类〔6〕.由于使用了专业技术词典分类精度明显高于面向普通文档系统较好地保证了检索Web文档与用户需求相关性.
  3.3 基于Z39.50书目信息检索
  图书文献人们获取信息重要来源因此联机书目检索资源发现系统重要组成部分.图书馆联机书目检索服务传统上通过Telnet方式提供.近年来许多图书馆采用Web加CGI形式书目检索提供图形化界面.些服务方式重要缺陷于各图书馆书目检索界面用户要检索每图书馆必须熟悉相应界面.ISO制定了Z39.50协议检索远程图书馆书目标准〔7〕.Z39.50运行TCP/IP协议之上应用层协议.规定了客户机查询服务器及提取结记录等过程所涉及数据结构和数据交换规则从而解决了现存书目数据库检索接口异构性问题.目前该标准已经被国外许多图书馆所采纳国内尚未有家图书馆提供基于Z39.50书目检索服务.我们设计了基于Z39.50联机书目检索模型此基础上成功地开发出国内第套基于Z39.50书目信息检索系统〔8〕图3所示.

  图3 基于Z39.50书目信息检索模型

  该模型图书馆书目存放数据库服务器或几书目数据库.Z39.50服务器约定端口上侦听用户连接请求(InitRequest).成功地建立连接Z39.50客户发出查询请求(SearchRequest)Z39.50服务器接收抽象Z39.50标准查询转换具体SQL查询提交给台数据库服务器执行生成查询结集.Z39.50服务器查询执行情况及部分结返回.Z39.50客户多次发出提取请求(PresentRequest)来获得结所有书目数据.了使Z39.50客户能够同时查询多图书馆书目我们客户端采用多进程(多线程)和多服务器并发地建立连接并对查询结进行处理包括综合各进程查询结、消去其重复出现书目等.
  3.4 基于Agent用户接口
  资源发现系统用户接口用户与信息资源之间起着桥梁作用.由于信息资源大容量、动态性和复杂性传统人机交互方式显得无能力.基于Agent用户接口被认解决人机交互问题突破口〔9〕.目前Agent技术研究虽十分流行对于其定义和特征还没有统结论.我们从软件抽象角度出发给出下定义.
  定义3. Agent种抽象手段用来描述复杂系统又能够描述系统与用户之间交互.
  定义4. 用户接口Agent用户与计算机系统接口时使用种形象化抽象简要地表示四元组(Task, Knowledge, Constrain, Status).其Knowledge知识库保存从外界学习知识用户信息需求和爱好等;Constrain约束条件集合用户对Agent运行时间作出限制等;StatusAgent运行状态集合;Task任务求解模块知识库、约束集、状态集基础上运用推理规则处理事件及完成任务.
  用户看来用户接口Agent半自主应用程序.方面拥有知识了解用户需求和爱好能够代表用户智能地完成某任务并具有学习和适应能力;另方面受用户控制.用户观察活动状态临时性地暂停或恢复其活动甚至永久性地撤销.用户接口Agent资源发现系统执行任务多种多样.当系统增添了用户感兴趣信息资源时Agent通知用户. Agent也根据用户需求或偏爱对信息资源进行过滤建立性化界面.基于Agent用户接口用户与复杂、动态信息世界进行交互提供了重要手段.

  4 基于Internet资源发现系统原型

  上述讨论基础之上我们开发了资源发现系统原型RDSCC(resource discovery system for computer community). RDSCC面向计算机学科领域专业资源发现系统其目该领域研究人员提供Internet资源发现服务掌握本专业全面、新信息.该系统结构图4所示.

  图4 Internet资源发现系统原型RDSCC

  RDSCC由8模块组成.其文档数据库系统负责管理半结构化文档资源.了提高易用性我们采用Web服务器来向用户提供资源发现服务.转换器作Web服务器和文档数据库系统文档数据库内容转换成HTML格式把用户输入转换成对文档数据库系统操作.Web文档收集与分类器下载符合用户信息需求有关计算机方面Web文档并进行自动分类.元数据抽取器从已分类文档抽取文档元数据导入器文档和元数据存储Web文档库并建立索引.Z39.50网关提供基于Z39.50书目检索服务依据用户通过HTML表单提交查询请求(包括查询哪些图书馆及何种计算机书目)同时查询多图书馆Z39.50服务器.
  用户利用浏览器进行各种多维文档分析操作从多角度来阅读和检索文档库内容.系统还利用Agnet技术用户提供了配置(profile)机制用户订阅文档定制浏览界面.

  5 结束语

  信息充斥情况下基于Internet资源发现服务具有极大潜力研究方向用户从分布同资源发现系统获取所需信息资源.本文提出了分布协作式资源发现策略对资源发现系统开发所涉及数据模型、Web文档检索、书目检索及用户接口等关键技术作了研究并简要介绍了网络信息服务系统原型RDSCC.该领域仍有许多问题值得深入探讨包括:DCOM/CORBA计算环境上实现多资源发现服务器之间分布协作;利用HTML、XML等规范从Web文档抽取元数据等等些都我们下步要进行工作.

  *本课题得江苏省九五科技重点攻关项目(项目编号BE96017)和江苏省教委图书馆自动化项目资助.
  作者简介:王继成1973年6月生博士研究生主要研究方向计算机网络、信息处理.
  邹涛1970年11月生博士研究生主要研究方向计算机网络、信息处理.
  杨小江1965年6月生博士研究生主要研究方向超媒体、信息处理.
  潘金贵1952年1月生教授主要研究方向间件、Agent技术.
  张福炎1939年11月生教授博士生导师主要研究方向多媒体、CAD与图形学、信息处理.
  作者单位:南京大学软件新技术国家重点实验室 计算机科学与技术系 南京 210093

  参考文献
  1 Gudivada V N et al. Information retrieval on the world wide web. IEEE Internet Computing, 1997, 1(5): 58~68
  2 Lawrence S, Giles C L. Searching the world wide web. Science, 1998, 280(5360): 98~100
  3 Lawrence S, Giles C L. Context and page analysis for improved web search. IEEE Internet Computing, 1998, 2(4): 38~46
  4 王珊等. 数据仓库技术与联机分析处理. 北京:科学出版社, 1998
  (Wang Shan et al. The Technology of Data Warehouse and OLAP(in Chinese). Beijing: Science Press, 1998)
  5 Salton G et al. A vector space model for automatic indexing. Communications of ACM, 18(5): 613~620
  6 邹涛, 王继成, 张福炎等. 基于Web资料搜集系统设计与实现. 情报学报, 18(3): 195~201
  (Zou Tao, Wang Jicheng, Zhang Fuyan et al. The design and implementation of an information gathering system. Journal of the China Society for Scientific and Technical Information(in Chinese), 18(3): 195~201
  7 ANSI. Information Retrieval(Z39.50): Application Service Definition and Protocol Specification. ANSI/NISO Z39.50-1995. Bethesda, MD: NISO Press, 1995
  8 杨晓江, 张福炎等. 利用Z39.50提供联机书目检索服务. 软件学报, 10(8): 824~828
  (Yang Xiaojiang et al. Bibliographic retrieval based on Z39.50. Journal of Software(in Chinese), 10(8): 824~828)
  9 Baecker R et al. Readings in Human-Computer Interaction: Towards the Year 2000. Morgan Kaufmann Publishers, 1995

相关内容

    暂无相关文章