中文地址模糊匹配,中文单位名称模糊匹配软件技术

中文地址模糊匹配,中文单位名称模糊匹配软件技术

ID:5387887

大小:817.30 KB

页数:18页

时间:2017-12-08

中文地址模糊匹配,中文单位名称模糊匹配软件技术_第1页
中文地址模糊匹配,中文单位名称模糊匹配软件技术_第2页
中文地址模糊匹配,中文单位名称模糊匹配软件技术_第3页
中文地址模糊匹配,中文单位名称模糊匹配软件技术_第4页
中文地址模糊匹配,中文单位名称模糊匹配软件技术_第5页
资源描述:

《中文地址模糊匹配,中文单位名称模糊匹配软件技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、智能中文模糊匹配软件地址和公司名称的自动比对应用于信用卡审批风险规则上海协森计算机技术有限公司2012年12月公司介绍上海协森计算机技术有限公司公司团队前身,2003年属高阳科技(香港上市公司)国内银行信用卡应用服务事业部。2005年1月,团队独立,成立上海协森信息技术有限公司,主要从事银行业应用软件产品研发及项目集成服务。2008年12月,更名为上海协森计算机技术有限公司,注册资金增至300万元。主要客户:交通银行、中国建设银行、中信银行。团队:18人,其中软件工程师15人。苏信联系邮箱:suxin_ss@126.com联系

2、电话:18621996638主题中文模糊匹配技术为信用卡审批带来的好处模糊匹配理论体系中文模糊匹配工具应用体系结构中文地址模糊匹配算法原理企业名称模糊匹配算法原理模糊匹配在信用卡审批业务的应用批处理技术运行平台和性能测试客户化内容和服务本产品的客户案例模糊匹配技术为信用卡审批带来的好处信用卡审批流程的工作内容之一:比对客户信息申请表中的客户地址,分别与人行征信系统的客户地址、社保系统的客户地址、与公安局身份证地址等,比对申请表中的客户工作单位,分别与人行征信系统的客户工作单位、社保缴费的工作单位等,比对。现状:地址

3、比对、工作单位比对计算机系统提供准确匹配,约20%人工匹配,约80%。通常,申请表量较大的银行信用卡中心,约需要20人来做人工判断。引入智能中文模糊匹配软件工具计算机系统提供模糊匹配,约80%人工匹配,约20%,减少至原来的1/4。从原来的20人的工作量,减至5人做人工判断。效率提高4倍,节省人工成本每年约100万元。地址分团、单位分团,识别集团欺诈。模糊匹配理论体系模糊匹配的算法体系两个事物的匹配度=取值相同的属性的数量加权/属性的总数量加权属性有权重之分模糊匹配算法应用基于关键字的资料检索论文库检索地理信息

4、库检索基于分词的模糊匹配地址比对企业名称对比地址模糊匹配技术地址比对的取值为“是”和“非”,即1和0。理论上,地址模糊匹配的正确率是不可能达到100%。模糊匹配算法实现的目标匹配度匹配度100%100%50%50%0%0%模糊匹配工具应用体系架构实时接口文件接口地址两两匹配公司两两匹配黑名单(地址/公分团司名称)查询批量匹配查询行政区划库地址匹配单位名称匹配地址标准化道路库模糊匹配术核心算法地标库黑名单库单位同义词库黄页信息库行业信息库权重规则参数黑中介库中文地址模糊匹配算法原理基于分级结构的地址库的分词解析行政区划道路门牌号地标

5、名称楼号层号室号其他广东省广州天河路45号天伦大厦2号楼13楼市天河区行政区划段◦精确匹配,一票否决。道路段+门牌号、地标名称◦道路段在道路库中找到,则精确匹配,否则,模糊匹配◦地标名称与道路门牌的含义是重复的,今后建立地标库就可做到精确匹配。楼号+层号+室号◦模糊匹配规则与权重◦利用规则和权重的组合算法,最终得到两地址对比的匹配度。地址模糊匹配技术实现基于分词的地址匹配技术通过构造地址名称的分级体系,形成地址分词库。匹配处理的过程是,解析分词,匹配分词,得出匹配结果。简繁体字的转换汉字数字与阿拉伯数字转换采用这种方法,易

6、于维护地址分词库,并构建一个可自学习的地址库,不断丰富完善,提高匹配范围与匹配精度。地址比对接口API、HTTP字符预处理地址分词解析算法分段匹配算法要素参数信息管理行政道路地标同义其它区划库词库分词地址知识库行政区划库建立了三级行政区划库23个省、5个自治区、4个直辖市、2个特别行政区283个地级市374个县级市、1636个县、852个市辖区根据业务需要,行政区划可扩充到四级镇、乡、村道路库近100万条道路,并包含其对应行政区划的信息可升级的道路库自学功能同义词知识库机制地标与详细地址的对应关系同一地点的两种写法

7、的对应关系主要算法机制过滤特殊字符繁体转换为简体地址分词解析行政规划段地标知识库机制,地标名分词从字典中搜索道路门牌同义词并替换为标准名称解析道路段去除噪声词号码段(大写/中文)数字格式转换解析门牌号码段分段权重参数一票否决参数企业名称模糊匹配算法原理基于分词的模糊匹配算法企业标准名称,分段模糊匹配行政区+企业字号+行业属性+企业属性+分支机构+部门分段权重一票否决同义词及知识库机制知名企业的同义词,2000个企业同义词库行业库关键词库中文模糊匹配在信用卡审批业务中的应用申请表信息比对申请表,分别与人

8、行报告信息、公安部信息和社保信息,比对。申请表与历史申请表的信息的比对申请表与人行报告历史库信息的比对申请表与欺诈历史库信息的比对单笔黑名单查询批处理应用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。