欢迎来到天天文库
浏览记录
ID:36846592
大小:3.28 MB
页数:58页
时间:2019-05-16
《基于内容的敏感信息过滤系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、武汉科技大学硕士学位论文第1页摘要随着互联网发展和普及,人们可以在网络上获得各种信息,怎样防止青少年接触到色情内容是一个严肃的社会问题。要防止色情内容的蔓延,除了从法律角度采取措施外,从技术角度考虑的网络过滤技术是一种有效的手段。目前网络的过滤技术主要有三种,它们是基于URL过滤方式、基于文本的过滤方式和基于图像内容的过滤方式。这几种过滤技术各有优劣,有的实现比较简单,有的具有更广泛的适应性,有的效率高实时性更强。单一采用某一技术的准确性不高,而考虑到图片和图片附近的文字一般具有相同的类别,它们有相互补充说明的特性,所以综合考虑图片和文本的分类特点是本文研究的过滤方式。主要以过滤
2、敏感信息为主要目的,对基于内容的文本过滤技术和图像过滤技术进行了研究,主要讨论了文本过滤的特征提取和图像过滤中的肤色检测方面的技术,并根据敏感图像的特点,提出一种连通域探测算法,实验中该算法表现出更好的可靠性和更少的时问开销。另外结合贝叶斯和支持向量机(SVM)分类算法,实现了信息过滤系统的分类器,通过查准率、查全率为评价标准,在实验数据的基础上对敏感信息过滤系统进行了分析。本文提出了敏感信息过滤系统的实现方案,将各环节的特征提取和优化算法及分类等算法应用于文本和图像过滤模块,并对网络敏感信息过滤系统的实验结果进行分析,取得了较好的效果。为基于内容的敏感信息过滤技术的研究和应用提
3、供了一种思路和参考,具有一定的理论和应用价值。关键词:特征提取;文本分类;图像分类;机器学习第1I页武汉科技大学硕士学位论文AbstractWiththedevelopmentofInternet.peoplecanaccesstheInteractmoreandmorefrequently,butthereiSawiderallgeofbadimagespollutethenetwork.HOWtopreventchildrenfromaccessingpornographiccontentonlineiSaserioussocialproblem.Besideslegisla
4、tionway.itcallsforeffectivetechniquestokeepchildrenfromaccessingtheobj
5、ectionablecontent.Therearethreemainclassificationtechnologies"thefiltrationmethodbasedontheURL.themethodbasedontextandthemethodbasedonimagecontent.Eachabovementionedfilteringtechnologyhasitsadvantages,someareeasetorealize,
6、somehasmoreextensiveadaptabilityandsomehavehi西erefficiencyandbetterreal.timeperformance.Ifonlytakeonekindofthetechnology,itcannotobtainsatisfactoryaccuracy,SOconsidertotherelevanceofimageandtextnearbytheimageonweb,theyarecommonlymutuallycomplementary,socomprehensiveconsiderationoftheimageandt
7、extclassificationfeatureiSthefiltrationmethodiSresearchedinthispaper.SensitiveinformationfilteringiSthemainpurposeofthispaper.andresearchiSdoneonthetextfilteringtechnologyandimagefilteringtechnologybasedoncontent.Featureextractionmethodoftextfilteringandskindetectiontechnologyofimagefiltering
8、iSmainlydiscussedinthisPapel".Inaddition.apixellabeledalgorithmbasedonchaintableofconnectingareawasproposedaccordingtothecharacteristicsofsensitiveimage,andtheexperimentshowsthealgorithmiSbetterinthereliabilityandlesstimeconsuming.Tocompletet
此文档下载收益归作者所有