针对保险理赔单据的光学字符识别的研究与实现

针对保险理赔单据的光学字符识别的研究与实现

ID:37064156

大小:3.61 MB

页数:84页

时间:2019-05-16

针对保险理赔单据的光学字符识别的研究与实现_第1页
针对保险理赔单据的光学字符识别的研究与实现_第2页
针对保险理赔单据的光学字符识别的研究与实现_第3页
针对保险理赔单据的光学字符识别的研究与实现_第4页
针对保险理赔单据的光学字符识别的研究与实现_第5页
资源描述:

《针对保险理赔单据的光学字符识别的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文针对保险理赔单据的光学字符识别的研究与实现作者姓名叶智铭工程领域软件工程校内指导教师黄敏副教授校外指导教师吴珮琪经理所在学院软件学院论文提交日期2018.4.14ResearchandimplementationofOpticalCharacterRecognitionforInsuranceClaimsMaterialADissertationSubmittedfortheDegreeofMasterCandidate:ZhimingYeSupervisor:Prof.HuangMinManagerWuPeiqiSouthChinaUniversityofTechnolo

2、gyGuangzhou,China分类号:TP311学校代号:10561学号:201520209983华南理工大学硕士学位论文(针对保险理赔单据的光学字符识别的研究与实现)作者姓名:叶智铭指导教师姓名、职称:黄敏副教授;吴珮琪经理申请学位级别:工程硕士工程领域名称:软件工程论文形式:□产品研发□工程设计√应用研究□工程/项目管理□调研报告研究方向:光学字符识别论文提交日期:2018年4月14日论文答辩日期:2018年5月26日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:张平健委员:黄敏陈虎徐迪威汤德佑摘要随着经济的发展,保险业间竞争日益激烈,依靠传统手段拓展市场已经

3、难以满足市场的需求,为了提高自身竞争力,保险公司对信息技术的投入不断提高。保险公司理赔部需要人工处理大量的理赔单据,每天需要对不同的理赔单据进行数据录入,分析与分类。这种反复的工作不但增加了保险公司的运营成本,而且效率低下并且错误率高。在当今保险行业中保单录入的环节已经实现了光学字符识别的录入,由于新保单格式规范,清晰度高,识别效果令人满意。但是理赔单据(用药清单)的自动录入一直没有实施,其主要原因是用药清单来自不同的医疗机构,药物与医疗项目等明细信息表达各不相同,没有统一规范。而且单据的清晰度较低,无法通过简单的数据扫描进行系统录入,中间过程仍需人工干预。本文通过对医疗单据(用药清单)进

4、行图像预处理,结合光学字符识别技术,解决用药清单的自动录入问题,为不同的系统提供用药清单识别功能。主要工作如下,1.本文在识别前增加图像预处理操作,减少光照,图章和倾斜影响因素,使识别度提高至80%或以上。2.本文采用了开源的Tesseract作为识别工具,扩大其识别样本,并且通过机器学习训练Tesseract,减少由于原识别库对中文样本训练程度不足的问题,提高Tesseract对用药清单的识别能力。3.基于图像预处理和光学字符识别的用药清单识别结果仍然达不到理想的效果,通过对比概率,N-Gram和查字典法三种方法的适用性和优劣性,本文最终采用查字典法校对识别结果,通过匹对方式,修复形象字

5、导致的专业术语错误问题,从而使识别率提升至90%或以上。最后本文会通过对识别结果和实验进行分析,说明在研究过程中遇到的问题以及该方法的不足以及一些未来需要改进的方法。关键词:用药清单;机器学习;光学字符识别;TesseractAbstractWiththedevelopmentoftheeconomy,thecompetitionamongtheinsuranceindustrybecomesmoreandmorefierce.Ithasbeendifficulttosatisfythemarketdemandbyrelyingontraditionalmeanstoexpandthema

6、rket.Inordertoenhanceitscompetitiveness,theinvestmenttotheinformationtechnologybytheinsuranceindustryhascontinuouslyincreased.Theclaimsdepartmentsofinsurancecompaniesneedtomanuallyenter,analyze,andclassifyalargenumberofclaimsdocuments.Therepeatedworkincreasestheoperatingcostsoftheinsurancecompanyw

7、ithlowefficiencyandhigherrorrate.Inthecurrentinsuranceindustry,theentryofinsurancepoliciescanbeachievedwiththehelpofopticalcharacterrecognition.Thisisalsoowningtothenewformatoftheinsurancepolicy,high-definition,l

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。