电子就业文本挖掘系统关键技术研究与应用

电子就业文本挖掘系统关键技术研究与应用

ID:33292937

大小:2.54 MB

页数:66页

时间:2019-02-23

电子就业文本挖掘系统关键技术研究与应用_第1页
电子就业文本挖掘系统关键技术研究与应用_第2页
电子就业文本挖掘系统关键技术研究与应用_第3页
电子就业文本挖掘系统关键技术研究与应用_第4页
电子就业文本挖掘系统关键技术研究与应用_第5页
资源描述:

《电子就业文本挖掘系统关键技术研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江+Ji商火学硕.I:学位论文电子就业文本挖掘系统关键技术研究与应用摘要随着网络信息技术的快速发展,各大人才就业网站给就业者和用人单位提供了铺天盖地的就业信息,人们已经不必再担心信息量的匮乏。但是面对日益庞大的就业和人才招聘网站的信息,迫切需要人工智能的相关技术,对网络上的海量数据进行深层次的分析,及时搜索和抽取出对高校毕业生和用人单位有用的信息,提高大学生就业的时效性和成功率。本文主要针对电子就业领域的海量招聘信息用文本数据挖掘的方法进行分析和处理,从而对文本挖掘相关技术进行研究和应用。论文的主要工作包括以下几点:1、提出了一个基于QI—D

2、W的信息搜索算法(QIDWDS):针对网络信息的搜索,本文提出的基于查询接口的DeepWeb信息搜索算法(QIDWDS),通过搜索网络上含有DeepWeb的查询接口,实时地、高效能地搜索隐藏在DeepWeb(Dw)后台数据库中的网页信息。2、提出了一个基于DI—DOM的信息抽取算法(DIDOME):针对电子就业领域海量信息的流动性特征,提出了一种基于DOM树的动态流(DI)信息提取算法,对网页文本数据进行预处理。3、开发了一个智能电子就业文本挖掘系统:设计和实现了一个It蕞q{量量写_。量‘量I五;。,fIj,阿~浙江f.:商人学硕十学位论文电

3、子就业文本挖捌系统关键技术研究与庶心典型三层c/s结构的文本挖掘系统,用基于支持向量机的文本分类的方法实现了面向电子就业领域文本数据挖掘的应用系统。结合实际需求,对电子就业领域的专业信息建立专业性语料库,并对天津海量的分词系统进行了修正,同时对电子就业文本信息的特征计算和选取进行了特殊的处理。关键词:文本数据挖掘;DeepWeb信息;DOM树;支持向量机;文本分类IIKEYTECHNIQUESOFTEXTMINING,SREsEARcHANDAPPLICATIONONf‘///-///////.///。///////b/////z///////

4、5/////2///////4//I//ELECTRONICEMPLOYMENT1’。ABSTRACTDuetotherapiddevelopmenttechnologyofnetworkinformation,themajoremploymentwebsitescanprovidejobhunterswithlotsofinformation,whilepeopledon’tneedtoworryaboutthelackinginformationanymore.However,whenfacingwiththeincreasinglarge

5、numberofnetworkaboutemploymentandpersonnelinformationontheInternet,artificialintelligencetechnologiesisurgentlyneeded.Inordertoimprovethetimelessandsuccessrateofjob—hunting,itisnecessarytodeeplyanalysizethemassivedatainformationandquicklysortandextracttheusefulknowledgewhich

6、ishelpfultothosegraduates.Inthispaper,weusethemethodoftextminingtoefficientlydealwiththemassiverecruitmentinformationfromthefiledofelectronicemployment.Maincontributionsofthedissertationinclude:(1)amispaperpresentsanQI.DWinformationextractionHIalgorithm(QIDWDS):accordingtoth

7、einformationresearchtechnology,wesorttheinterfacewhichhastheDeepWebbasedontheDeepWebinformationsortingalgorithm,resultinginsortingthewebpageinformationhiddeninthebackgrounddatabase.(2)ADI—DOMinformationextractionalgorithm(DIDOME)ispresented:accordingtothedynamicfeatureaboutw

8、ebinformation,anregularexpressionalgorithmbasedontheDOMTressisproposedtopre

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。