地名地址数据规范

地名地址数据规范

ID:14211214

大小:202.00 KB

页数:4页

时间:2018-07-26

地名地址数据规范_第1页
地名地址数据规范_第2页
地名地址数据规范_第3页
地名地址数据规范_第4页
资源描述:

《地名地址数据规范》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、地名地址数据规范一、根据地名查询服务2.0要求,地名数据必须具有以下6个字段1、Domainname中文简称2、Standardname标准名称3、Gbcode行政区代码4、Addname中文地址5、Addcode地址代码6、Clsid分类的代码注:地名分类编码CLSID与分类查询有关,分类查询通过分类编码进行查询。CLSID字段可以从CODE地址编码中提取。同时为了方便数据入库后地名搜索服务相关设置,地名地址数据中的6个字段信息和映射字段信息一致,做到一一对应。如下图1、图2图1映射字段导入图2映射字段导入二、天地图地名数据分类规则1、类型代码

2、为固定为16位数,五级分类原则,每一级用三位数表示,取值为000-999(000表示为空)如下图32、为了避免以0开头造成位数不足,故在代码最前面统一添加一位编码1。3、若不满足16位,将会在后面补0,前一级为父类,后一级为子类,每一个父类可以有多个子类。具体分几类用户可以自定义。我们在分类查询中只分到二级分类,所以分类编码只需6位图3分类编码示例三、地名查询服务发布步骤:1、设置共享路径共享路径是为了存放地名和公交索引文件,当查询的时候直接查询本地的索引文件,而不是直接查询数据库,提高查询效率。共享路径一般在服务器上设置。如下图4图4设置共享路

3、径2、创建地名索引创建地名索引的过程就是在共享文件中生成索引文件的过程。图5创建地名索引创建地名索引时需要设置相应的表格,也可以使用系统默认文件,如果系统提示默认文件不符合实际要求可以根据需要整理放到系统中。地名类型表地名类型表中的CODE与地名数据表中的CLSID相对应,地名类型表主要用来进行地名分类查询。规范化的地名数据类型,将极大的优化搜索结果的精确度。该表的目标既是通过规范化的编码将地名的类型进行管理,通过某一类型能找到相关或所包含的类型,同时能够定义类型的级别,来对地名搜索结果进行一定意义上的排序。行政区划表行政区划表中的CODE(地址

4、编码)与地名数据表中GBCODE相对应。长度为6,采用的是国家统一的6位编码,可参考国家发布的行政区划国标码。有了这样规范化的行政区划编码,我们就能通过应用程序对查询结果做约束,判断出所查询的地名位于哪个行政区以及在地图上的位置范围,则所查询的地名必须是在此行政区划内的。例如:查询“武汉市肯德基”,通过“武汉市”这个词获取到行政区划表中的CODE值,此CODE值与地名数据中的GBCODE相关联,则将查询约束到“武汉市”这个行政区划中,缩小查询区域范围。同义词表存放同义词,主要是对用户输入的字符串跟同义词表进行对比看有没有同义词,如果发现有,则在查

5、询的时候带上相关同义词进行查询。表达为同一个意思的相近词语,其编码CODE值相同。拼音检查表主要是对用户输入的字符串跟拼写检查表进行对比看有没有错误的词语,如果发现有,把正确的词语和查询结果在客户端解析并在页面进行相应的提示,例如“您是不是要找XXX”。扩展词表扩展词表用于在地名进行模糊查询时提升匹配精度。进行关键字查询时,例如查询武大吉奥,为了使查询结果更加匹配,精度更高,可在扩展词中添加“武大吉奥”这个词,当用户进行查询的时候,将会查询与“武大吉奥”匹配度高的词,而不会将“武大吉奥”打断成“武大”“吉奥”等词来进行查询,同时也不会将“武大”“

6、吉奥”等一系列词笼统的查出来,当匹配到“武大吉奥”字样的相关词后,将会只显示此类词。停用词表停用词表可以将某些敏感词进行屏蔽,同时还有打断一个字段较长词的作用。例如:停用“办事处”,进行有关“办事处”词的查询,将不会返回带有“办事处”字样词的结果。3、服务创建和发布服务创建和服具体过程和以前一样,不在详细说明

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。