基于文本聚类的p2p流媒体特征码提取技术研究

基于文本聚类的p2p流媒体特征码提取技术研究

ID:33032373

大小:168.68 KB

页数:29页

时间:2019-02-19

基于文本聚类的p2p流媒体特征码提取技术研究_第1页
基于文本聚类的p2p流媒体特征码提取技术研究_第2页
基于文本聚类的p2p流媒体特征码提取技术研究_第3页
基于文本聚类的p2p流媒体特征码提取技术研究_第4页
基于文本聚类的p2p流媒体特征码提取技术研究_第5页
资源描述:

《基于文本聚类的p2p流媒体特征码提取技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘要III关键词IIIAbstractIllKeywordsIll1绪论11」研究背景11.2国内外研究现状11.3研究内容和研究目的21.3.1研究内容31.3.2研究口的31.4本文的组织结构32P2P流量识别技术32」典型的P2P流量识别技术42.1.1基于端口号的P2P流量识别技术42.1.2基于流量特征的P2P流量识别技术42」.3基于应用层签名的P2P流量识别技术42.1.4基于双重特征的P2P流量识别技术52.1.5基于统计行为特征的P2P流量识别技术52.1.6各种识别技术的比较52.2P2P流媒体流量识别技术62.3本章小结63基于文木聚类的特征值提取73

2、.1文本聚类定义及步骤83丄1文本聚类的定义83.1.2文本聚类过程83.2文本聚类的重点技术83.2.1文木表示83.2.2权值的计算103.2.3特征项的抽取113.3文本聚类算法123.3」基于划分的方法123.3.2基于层次的方法143.3.3基于密度的方法153.3.4基于网格的方法163.3.5基于模型的方法163.4本章小结164系统实现与测试164」文本预处理174.2特征提取174.3k・means算法184.4系统测试过程194.5聚类测试214.6本章小结225总结与展望235」总结235.2展望23参考文献24致谢26基于文本聚类的P2P流媒体特征码

3、提取技术研究摘要把P2P技术引入到流媒体传输中而形成了P2P流媒体技术。这些P2P软件占用带宽很大,为了保障其他用户的正常使用,运营商需要投入大量的资金用于网络建设。本文提出采用基于统计的方法对P2P流媒体进行特征码的提取,然后对提取出的特征码采取文本聚类的方式进行归类,着重讨论如何运用文本聚类的方式对提取出的特征码进行归类的问题。文木预处理采用基于统计的hash算法,特征值提取采用字符串频率统计,并选择一个合适的阀值来进行特征的抽取,聚类算法使用k-means算法。最后,设计了一个P2P流媒体的特征码提取及分类的系统,把文本聚类的技术应用到P2P流量的分类小,并通过实验验

4、证算法的可行性。关键词P2P流量;文本聚类;特征码提取与分类;k-means算法ResearchOftheSignaturesExtractionTechnologyOfP2PStreamingMediaBasedOnTextClusteringAbstractIntroducingP2PtechnologyintostreamingmediatransmissionformstheP2PStreamingMediatechnology.Inodertoprotectthenormaluseofotherusers,operatorsneedtoputinalotoffun

5、dsfornetworkconsructionbecauseofP2Psoftwareoccupiedagreatofthebandwidth.ThispaperproposedamethodbasedonstatisticsonP2Pmultimediastreamingforsignatureextraction,andthenthesignatureoftheextractedtextareclassifiedbyclusteringapproach,focusedonhowtoclassifytheextractedsignaturebytextclustering

6、.Textpre-processingusedforthisexperimentbasedonthestatisticsofthehashalgorithm.Thesignatureextractionbasedonthefrequencyofastringofthetextdocumentandamoreappropriatethresholdisselectedforthecharacteristicsofthesamples.Theclusteringalgorithmisk-meansalgorithmwhichissuitableforthesystem.Fina

7、lly,asystemisdesignedwhichisusedtoextractP2Pmultimeidastreamingandclassifytheextractedsignature.TextclusteringtechniqueisappliedtothecharacteristicsofP2Ptrafficclassificationandthefeasibilityofalgorithmisverifiedbyexperiment.KeywordsP2Ptraffic;Textclustering;S

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。