基于关键词的云计算语义文本自适应分类-论文.pdf

基于关键词的云计算语义文本自适应分类-论文.pdf

ID:53762298

大小:442.58 KB

页数:7页

时间:2020-04-24

基于关键词的云计算语义文本自适应分类-论文.pdf_第1页
基于关键词的云计算语义文本自适应分类-论文.pdf_第2页
基于关键词的云计算语义文本自适应分类-论文.pdf_第3页
基于关键词的云计算语义文本自适应分类-论文.pdf_第4页
基于关键词的云计算语义文本自适应分类-论文.pdf_第5页
资源描述:

《基于关键词的云计算语义文本自适应分类-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第7期计算机工程2014年7月、,01.40NO.7ComputerEngineeringJuly2014·开发研究与工程应用·文章编号:1000—3428(2014)07-0247-07文献标识码:A中图分类号:TP393基于关键词的云计算语义文本自适应分类沈佳杰,江红,王肃(华东师范大学信息科学技术学院,上海200241)摘要:传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并

2、将提取出的中文关键词传输到中心数据库端进行整合,从而确定文本本身类别。通过理论证明在关键词提取数量足够的情况下,提出的文本分类算法可以在保证中文文本分类效果的前提下,有效降低网络传输的代价,从而提高中文文本分类算法在云计算环境下的性能。实验结果验证了该算法在云计算环境下的可行性以及理论推导的正确性。关键词:云计算;关键词提取;文本分类;语义计算;网络传输代价;中文文本语义SemanticTextAdaotiveClassificationBased0nKeywordUnderCloudComputingSituationSHENJia-ji

3、e,JIANGHong,WANGSu(SchoolofInformationScienceandTechnology,EastChinaNormalUniversity,Shanghai200241,China)【Abstract】Aimingtoproblemol、thetraditionaltextsemanticclassifyalgorithmcannotefficientlyclassifyChinesetextundercloudcomputingsituation,adistributionChinesetextclassif

4、icationalgorithmbasedonkeywordundercloudcomputingsituationispresented,usingmethodofdistributionextractingkeywordinagent—sideandmergingthekeywordinthemasterdatabasesidetoclassifyChinesetextintodifferentkinds.Thoughthetheoreticalderivation,underenoughkeywordsextractedsituati

5、on,thealgorithmcanensuretheresultoftextclassificationandreducethecommunicationcostofnetwork.Thecorrectnessoftheoreticalderivationandthealgorithmisverifiedbytheexperiment.【Keywords】cloudcomputing;keywordextraction;textclassification;semanticcalculation;communicationcostofne

6、twork;ChinesetextsemanticDOI:1O.3969/j.issn.1000—3428.201407.051步骤1对于文本进行预处理,如分词,并对词语进行1概述词性标注。随着互联网和云计算技术的发展,越来越多的应用被步骤2使用一定的规则对文本中的信息进行关键词的部署到了云端。如何在保证分类准确度的情况下,提高文提取。本在云计算环境下的分类效率以及减少对于整体网络带宽对于步骤1分词已经有了很多不同的算法[。],而对于的开销,从而高效地在云计算环境下对文本进行分类成为步骤2,现在比较主流的关键词提取算法有基于统计特征的一个亟

7、需解决的问题。关键词提取算法、基于语义的关键词提取算法[1以及基于本文提出一个云计算环境下的基于语义的中文文本关词语网络的关键词提取算法【],并且相关的语义提取技术键词自适应分类算法,通过对于文本关键词传输而不是文也已经应用到了很多的领域,如语义的相似性[]、语义与频本本身的传输,减少云计算环境F对于分类通信的代价。率的关系[,以及对于网页关键词的抽取。本文介绍基于语义的任务调度算法。基于文本语义的2文本处理技术及云计算简介关键词提取算法相较于一般的关键词提取算法,其最大的2.1集中式情况下常见的关键词提取技术区别在于这种算法不仅关心词语在

8、文本中的位置和数量信对于集中式文本关键词提取算法大致可分成以下2步:息,还需要结合语言本身的特点,如词语的词性和语法的基金项目:国家“863”计划基金资助项目(2013AA01A

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。