欢迎来到天天文库
浏览记录
ID:36850925
大小:1.60 MB
页数:58页
时间:2019-05-16
《一种文本聚类原型系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、大连理工大学硕士学位论文一种文本聚类原型系统的设计与实现姓名:刘延亮申请学位级别:硕士专业:系统工程指导教师:党延忠20060601大连理工大学硕士学位论文摘要本文提出了一种文本聚类系统原型的设计与实现。该系统的设计是针对国家自然科学基金“项目管理中项目关联分析与立项决策支持系统研究”的实际需求而产生的。在自然科学基金的评审过程中,需要由专家对大量的立项建议书进行评审,这一工作是相当繁重的,而文本聚类系统的应用,可以大大减小工作强度,提高工作效率,节约评审时间。本文设计了文本聚类系统的原型框架,并在该体系框架下,详细地讨论了系统中各个子系统的分析设计和实现。本文
2、主要在以下方面开展工作:(1)深入研究了聚类算法中的平面划分法,采用Java语言编程实现了典型算法k平均值算法和k中心点算法,用来对立项建议书进行聚类分析。(2)申请书中大量存在的同义词和没有类别特征词对聚类的精度影响较大,因此,在系统中加入了同义词的合并和无特征词的去除,提高了聚类分析的准确率。(3)在聚类分析结束以后,对分析结果进行了标注,得到了类模型。然后利用类模型实现对新文本的分类。(4)采用Java、JsP技术开发了B/s模式下用户操作子系统。该子系统采用了JSP技术,实现了人机交互,方便了用户使用,并且通过程序将分析结果画成图形,给出了直观的表示。关
3、键词:聚类;文本聚类;k平均值;k中心点一种文本聚类原型系统的设计与实现DesignandRealizationofTeXtC1usteringProtot),peSystemAbstractT1lispaperproVides也edesigna11drealizationofateXtclust吲ngprototypesystem.Thesystenlisdesignedtomeett11edemalldsofanac舡a1projectwhichbelongstoNationalN栅a1ScienceFound撕onofChina(NSFC).neev加撕o
4、nofprojectapplicationsneedsmanyexpertstoev“uatelotsofappIicatiollswhichisaveryhe玎v)rwork.Usingthetextclusteringsystemcanreduce也eworkintension,i埘lproVeemciencyandsave廿me.Thispaperdesignsthesystem撕caTchitectllreoftextclusteringsyStem.AndunderthissystematicarcllitectIlre,ithasdiscuSsedt
5、lIeanalysis,desi弘aIldrealizationofeachsubsystemindet札InlemajorcompletedworksareasfoIIoWs:(1)Lucubratest11eparlitiollingmetllodsincluSteringalg鲥mms,implemenIsclassick·meansalgorit№a11dk-medoidsalgoritllInwhichareusedtoclusteringtheprojectapplica丘ons.(2)Lotsof也esaurIlsa11dwordsmatdoesn
6、othaveclassfeat【lresreducethecIuste】血gprecision,sothesystemprovjdesmanagementof也esa哪sandno-featllrewords,aIldiInpmvesprecision.(3)ARerclusteringanalysis,1abelcluste血gresllltscreatesclassmodels.nlenclaSsi母newtcxtsusingclassmodels.(4)useroperationsubSy5temwhichisunderB/smodeisdeveloped
7、byado硼ngJavaandJSPtechnology.T}1issubsystemregardsJSPascontr01techn0109ymlichisconveniemtouse,andprovidesvisual缈phoftl】eresults.KeyWords:Clustering;TextCluste血g;K—means;K—medoids独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他
8、单位的学位或证书所使用过
此文档下载收益归作者所有