基于基础地名库的地名查询与定位方法研究与应用

基于基础地名库的地名查询与定位方法研究与应用

ID:32467901

大小:33.66 KB

页数:7页

时间:2019-02-06

基于基础地名库的地名查询与定位方法研究与应用_第1页
基于基础地名库的地名查询与定位方法研究与应用_第2页
基于基础地名库的地名查询与定位方法研究与应用_第3页
基于基础地名库的地名查询与定位方法研究与应用_第4页
基于基础地名库的地名查询与定位方法研究与应用_第5页
资源描述:

《基于基础地名库的地名查询与定位方法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于基础地名库的地名查询与定位方法研究与应用康风光,苏德国,宋全红(中国测绘科学研究院,北京市海淀区北太平路16号,100039)[摘要]面向业务数据的GIS展示与管理的需求,鉴于业务系统中地名位置信息的缺失,在研究了地名信息的查询与定位技术的基础上,提出了一种基于基础地名库的地名查询与定位方法,该方法在实践中得到了应用。[关键词]地名库地名查询地名定位汉字模糊音1引言:地名查询定位是GIS应用中的一个常用功能,即根据给定的地名查询条件,从地名数据库中筛选出符合条件的地名显示输出,然后根据所查询地名对应的经纬度坐标实现在地图上的定位。随着国家、地方、社会各部门信息化水平

2、的提高,方方面面的业务数据、统计数据及其它数据急剧增长,值得注意的是,大多数的业务数据与地理位置都有着紧密的联系。而通过GIS实现对业务的管理逐渐成为一种趋势而被大家所认同,但通常的业务系统数据库中地理位置相关数据不存在经纬度坐标的信息,只是地理位置的名称或者近似名称,所以不能直接通过GIS来管理和展示业务信息,为满足这种需求,本文提出了一种基于基础地名库的地名查询与定位的实现方案,借助于基础地名库的空间位置信息,采用基于汉字模糊音的地名查询方法,实现了地名的查询与定位,进而满足了对于业务信息通过GIS展示的需求。2总体路线该方案的实现分为以下几个过程:(1)建立汉字模

3、糊音库,以Windows操作系统输入法为基础生成汉字模糊音库;(2)业务地名模糊音化,根据汉字模糊音库,将业务数据库中的地名信息模糊音化;(3)地名匹配,建立基础地名库和业务地名信息的一一对应关系;(4)地名查询,根据客户端输入的模糊音,在业务地名库中搜索;(5)地名地位,在搜索结果中点选某一地名,根据基础地名库和业务地名信息的对应关系,确定位置,实现地名的地图定位。总体路线图如下:地名匹配业务地名模糊音化基础地业务地汉字模名库名库糊音库提取地名模糊查询汉字拼音文件地名GIS定位3关键技术及实现3.1基于汉字模糊音的地名查询方法的模糊音地名库的建立目前,GIS实现地名查

4、询功能一般有5种方法:全字匹配查询方法、字符串匹配度函数查询方法、基于SQL通配符的汉字匹配查询方法、基于全文检索技术的查询方法和基于汉字模糊音的地名查询方法。本文采用基于汉字模糊音的地名查询方法,即以汉字拼音首字母作为汉字的模糊音,给定查询条件时以模糊音代替原来中文输入,从地名数据库中筛选出与该模糊拼音相匹配的地名显示输出。本节的地名库指的是业务系统中的地名库,没有位置信息,区别于基础地名库。(1)建立汉字模糊音库利用Windows操作系统输入法的汉字拼音文件WINPY.MB作为原始资料,实现了汉字模糊音库,具体步骤如下:在业务数据库系统中建立汉字模糊音库,数据库表结

5、构如下:列名数据类型长度允许空描述IdInt4标识id、主键HzVarchar2单个汉字FbVarvhar1汉字模糊音利用Windows输入法生成器将WINPY.MB转换为纯文本文件winpy.txt,删除winpy.txt文件的文件头(即文件前12行),保存。提取汉字及其对应的模糊音存储到汉字模糊音库中,提取过程如下图所示:开始读取winpy.txt中的字符串否是否为单字行是是否为单字音是提取汉字和拼提取汉字和第一个音首字母拼音的首字母将汉字和模糊音宝村至汉字模糊音库中否到达文件末尾是结束(2)建立模糊音地名库在地名信息表中插入地名模糊音字段,为每一个地名生成模糊音,

6、处理过程如下:a访问地名信息表,读取地名及地名标识至数据集中;b访问数据集中每行数据的地名字段,将其每个汉字通过汉字模糊音库找到对应的模糊音;c对于每个字的模糊音按照在地名中的先后顺序进行组合,形成地名模糊音,根据地名标识存储至数据表的汉字模糊音字段,对于多模糊音的字进行特殊处理,与其他汉字的拼音首字母逐一匹配后形成多个模糊音组合,然后分别以特殊符号(比如“,”)分割连接成一个字符串存入数据库中;d按照b、c两个步骤遍历整个数据集直至结束。3.2地名匹配方法与实现为了利用基础地名库中的位置信息,实现地名查询的精确定位,需要在基础地名库与业务系统的地名库之间建立一一对应关

7、系。这样,在查询时,根据查询到的地名通过地名对应关系可以直接找到目标地名的经纬度坐标,从而实现业务数据在GIS的定位显示。因为在业务数据库中地名信息相对基础地名库中的地名信息不规范,可能是标准地名的简写、约定俗成的习惯说法、或者是在标准地名的基础上加入了其他的辅助信息等等,大概有以下几种情况:一是,业务数据库的地名信息中存有标准地名的全部信息;二是,标准地名中存有业务数据库中地名的全部信息;三是,即无论是业务数据库中的地名数据还是标准地名数据都不能互相包含;根据以上三种情况,前两种情况可以利用数据库SQL查询语言的模糊匹配功能直接实现地名

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。