robot技术在空间信息服务搜索中的应用研究

robot技术在空间信息服务搜索中的应用研究

ID:33653878

大小:173.74 KB

页数:6页

时间:2019-02-28

robot技术在空间信息服务搜索中的应用研究_第1页
robot技术在空间信息服务搜索中的应用研究_第2页
robot技术在空间信息服务搜索中的应用研究_第3页
robot技术在空间信息服务搜索中的应用研究_第4页
robot技术在空间信息服务搜索中的应用研究_第5页
资源描述:

《robot技术在空间信息服务搜索中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、∗Robot技术在空间信息服务搜索中的应用研究李慧敏,邬群勇,王钦敏福州大学福建省空间信息工程研究中心,空间数据挖掘与信息共享教育部重点实验室,福建福州350002摘要:目前对空间信息服务的研究主要集中于其本身的技术,系统设计及应用等方面,而缺乏对发布在网络上的空间信息服务的搜索研究。结合空间信息服务搜索的现实需求及使用Robot技术搜索信息的优点等方面,提出了一种使用robot技术对空间信息服务进行自动化搜索的方法,并通过实验验证了方法的可行性。关键词:robot空间信息服务搜索中图分类号:TP31文献标示码:A0引言据统计,人类生活中的数据有80%都和空间信息有关。而随着We

2、b服务技术,网络技术的发展,基于Internet的空间信息共享已经有了长足的进步。互联网上提供空间信息服务的站点与日俱增,种类和数量也越来越多,用户对分布在Web上的空间信息服务需求也越来越大,因此,如何在浩如烟海的信息中找到用户自己感兴趣的空间信息服务,成为目前面临的一个新问题。汪意革等人(文献1)结合ASP和DOM技术实现了简单的WebGIS地图搜索功能,白玉琪(文献2)对基于OpenGISWMS规范的空间信息搜索引擎进行了研究。然而由于空间信息具有动态性,分布性,多样性等特点,且这些空间信息服务之间缺乏有机的联系,面向空间信息服务的自动化搜索之类的研究还没有成熟的技术方案。

3、目前的搜索引擎技术已经发展得很成熟,并得到了广泛的应用。但是由于空间信息比其他信息更为复杂,而Google等通用的搜索引擎一般只涉及普通Web页面,虽然目前提供的静态图像查询功能,在一定程度上可以查到图形化表示的空间信息,但由于这种查询缺乏语义支持,因此查询的准确率较低。鉴于此,本文将机器人搜索引擎的关键技术Robot引入空间信息服务搜索中,并建立空间信息服务搜索器的原型,该原型结合Robot技术获取信息量大、更新及时的优点,并根据OGC的空间信息服务规范对其信息进行实时筛选,有效解决了应用Robot技术存在过多冗余信息和查询空间信息服务准确率低的缺点,很好地满足用户进行空间信息

4、服务搜索的需求。1Robot技术与空间信息服务搜索分析1.1Robot技术分析Robot是一种通过HTTP协议获取远程站点中的Web文档信息,并根据其中的超文本链接递归遍历整个WWW信息空间的软件程序(文献3,4)。它一般驻留在服务器上,通过给定的一些URL,利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问过的URL作为新的起点,继续进行Robot漫游,直到没有满足条件的新URL为止(文献5)(如图1所示)。Robot的主要功能是自动从Internet上的各Web站点抓取Web文档并从该Web文档中提取一些信息来描述该Web文档,为搜索引擎的数据库服务器追加和更新

5、数据提供原始数据,这些数据包括标题,长度,HTML文件中的各种链接数目等。在自动加载方式下,它首先以一个或一组URLs为搜索起点,对相应的Web文档进行访问。当文档被取走后,它所包含的超级链接将被Robot作为新文档的起点,如此循环反复,从而实现了对Internet上Web文档信息的收集。∗基金项目:福建省自然科学基金项目(D051007);福建省科技计划重大专项前期研究项目(2006HZ1006)作者简介:李慧敏(1982-),女,硕士研究生,研究方向:空间信息网络共享,E-mail:lhm922117@163.com;邬群勇(1973-),男,山东诸城人,博士,助理研究员,主

6、要从事计算机应用与地理信息系统研究;王钦敏(1948-),男,研究员,博导,主要从事地球信息科学与电子政务方面的研究起始链接URL列表路径选择待搜索链接URL列表文档访问取得一个链接URL过滤资料获取超级链接信息链接URL的资源信息信息分析文档索引处理图1Robot的运行机制(文献6)对于搜索器的搜索策略,即当Robot搜索到一个文档之后,下一步应该转移到哪个文档的方法问题,通常有IP地址搜索策略,深度优先搜索策略,广度优先搜索策略。IP地址搜索策略的优点是搜索全面,能够发现那些没被其他文档引用的新文档的信息源,但不适合大规模搜索。深度优先搜索策略能够遍历Web站点深层次的,嵌套

7、的文档集合,但是由于实际网络结构的统一管理程度较低,这种搜索进程往往因为看不到尽头而显得盲目。广度优先搜索策略虽然能够找到两个Web文档之间的最短路径,并且对深层次的文档进行搜索时不会象深度优先算法那样导致搜索无法结束,但是需要花费很长的时间才能到达较深层次的文档。可见采用单一的搜索策略往往无法将网络的实际状况考虑在内,从而降低了搜索的准确率和效率。实际搜索中,通常采用几种搜索策略结合的方法搜索,常用深度优先与广度优先结合的搜索策略。1.2空间信息服务搜索分析广义的空间信息服务是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。