欢迎来到天天文库
浏览记录
ID:34427666
大小:715.59 KB
页数:57页
时间:2019-03-06
《面向网络知识服务医疗信息分类方法 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP391.3学校代码:10213UDC:621.3密级:公开硕士学位论文面向网络知识服务的医疗信息分类方法硕士研究生:乙峰导师:王晓龙教授副导师:陈清财副教授申请学位:工学硕士学科、专业:计算机科学与技术所在单位:深圳研究生院答辩日期:2010年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3UDC:621.3DissertationfortheMasterDegreeofEngineeringWEBKNOWLEDGESERVICEORIENTEDOF
2、MEDICALINFORMATIONCLASSIFICATIONAPPROACHCandidate:FengYiSupervisor:Prof.XiaolongWangAssociateSupervisor:AssociateProf.QingcaiChenAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScience&TechnologyAffiliation:ShenzhenGraduateSchoolDateofD
3、efence:December,2010Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要从互联网开始普及以来,如何充分利用大量、不同结构、动态的互联网资源就成为信息时代的核心课题之一。信息检索是给网络用户提供网络知识服务的关键技术。但是目前也面临不能提供很好的服务及不能发挥网络信息应有价值的挑战。网络知识服务通过对海量信息的加工整理,提供经过验证的、更加确切可信的知识,而不仅仅是原始网页信息,网络知
4、识服务是下一步的发展方向。而要提供网络知识服务,必须完成一下四个核心工作:知识获取、知识表示、知识验证和知识服务。目前知识获取工作主要是主题搜索引擎技术,但是也面临着适应范围小、针对性强的挑战。在知识表示方面,Berners等在1998年提出的语义网,但语义网本身并没有解决知识获取、推理与服务等方面的问题。本文通过对网络知识服务的研究,提出了面向网络知识服务的健康文本分类方法,主要研究工作有以下几点:(1)设计实现了面向网络知识服务的健康垂直搜索系统,依据垂直搜索引擎爬虫技术,应用分类器预测的方法
5、影响爬虫策略,采集高相关性的数据。(2)基于本体的语义描述为知识的表示提供了一种通用、可行的方法参考。采用本体构建技术,本文构建了健康本体系统,并在此基础上实现文档理解、文档表示和知识推理。(3)结合健康本体体系,建立了健康知识库,为健康文本分类提供了基础的支持。(4)通过对不同特征选择方法和不同分类算法结合的实验对比,提出了基于改进TF-IDF特征选择算法和改进互信息算法的健康分类算法,并通过实际系统实现验证了该方法在健康文本分类中的优越性。本系统已经发布在网络上。实验结果及用户反馈表明,本文提
6、出的网络知识服务体系结构,能够较好的满足用户需求,提高了用户体验度,达到了预期效果。关键词网络知识服务;文本分类;特征选择;自然语言处理;健康本体I哈尔滨工业大学工学硕士学位论文AbstractFromtheInternetstartedtopopularize,howtomakefulluseoflarge,differentstructure,dynamicofInternetresourceshasbecomeoneofthecoresubjectofinformationera.Infor
7、mationretrievalisfornetworkuserswiththekeytechnologyofnetworkknowledgeservice.Butarealsofacingcannotprovidegoodserviceandcannotmakefulluseofnetworkinformationapplicationvaluechallenge.Throughprocessingofthelargeinformation,Networkknowledgeserviceprovi
8、dereal,crectlyknowledge,notonlytheorientedinformation.Newworkknowledgeserviceisthenextdevelopmentdirection.Therearefourstepstoprovideknowledgeservice:knowdgeacquisition,knowledgerepresentationandknowledgevalidationandknowledgeservice.Thecurren
此文档下载收益归作者所有