欢迎来到天天文库
浏览记录
ID:35188322
大小:7.36 MB
页数:62页
时间:2019-03-21
《社交网络中垃圾内容过滤方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、乂连謹^大葦DALIANUNIVERSITYOFTECHNOLOGY破±享恆巧文MASTE民ALDISSERTATION^f,社交网络中垃圾内容过滤方法研究软件工程学科专业作者姓名王指导教师週宽么2016年6月2日答辩日期'.■硕±学位论文社交网络中垃巧内容过滤方法研究ResearchonSamFilteringMethodBasedonSocialNetworksp作者姓名:于维扬学科、专业:软件工程
2、11学号:237033指导教师:周宽久;同衣0曰完成日期:琴夫么巧义夫#DalianUniTliverstyofechnoogy大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中己经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他己申请学位或其他用途使用过的成果一研究所做的贡献。与我同工作的同志对本均巴在论文中做了明确的说明并表示了谢意。若有不实之处,
3、本人愿意承担相关法律责任。学位论文题目:社交网络中括圾内容过滤方法研究fi心作者签名::年6月f日^日期大连理工大学硕±学位论文摘要社交网络中垃圾内容过滤的核屯、方法现今主要分为基于规则的模式匹配过滤方法和基于非平衡数据集的机器学习过滤方法,。随着智能终端设备的普及社交网络信息的一实时数据量爆炸式增长,两大方法协同使用成为过滤其中垃圾内容的主要方案。第层一次过滤使用第种方法,不断追求更快的处理速度,第二层次过滤使用第二种方法,不断追求更高的分类能力。本文在这两个方向均
4、提出了自己的想法,相关研究工作如下:在基于规则的模式匹配过滤方法这方面,为了有效提升处理速度,提出基于硬件FPGA的多模式匹配算法ACF。ACF算法借鉴AC状态自动机的思想,去掉Failure失败转移函数,构造基于4位的16叉树的匹配型状态自动机ACF算法是可行。实验表明的,处理性能相比同类算法显著提鳥,能更有效地用于垃圾内容过滤。在基于非平衡数据集的化器学习过滤方法这方面,为了有效提高分类能力,提出数据重采样算法SDR。SD民算法将过采样机制与欠采样机制相结合。过采样阶段根据数据的空间分布特点
5、构造更具分类能力的新数据。欠采样阶段使用聚类的方法,更多的保一留有价值的数据。并且通过迭代优化与去噪声的方法进步提高分类能力。实验表明SDR算法是可行的,相比同类算法具备更高的分类能力,能更有效地用于垃圾内容过滤。本文提出的两个算法均能更有效的解决社交网络中垃圾内容的过滤问题。关键词:垃巧内容过滤多模式匹配;现场:重采样;可编程口阵列--I社交网络中垃圾内容过滤方法研巧民esearchonsamFilterinMe化odB江sedonSocialNetworkspgAbs
6、tractNowadays,spamfilteringbasedonsocialnetworksmainlyincludestwocoremethods,usi打gpaternmatchi打gbasedo打rulesandusingmachinelearningbasedontheunbalanceddatasets.WUh化epopularityofin化lligent化rminalequipment,therealtime过ataof
7、tilesocialnetworksinformationisexlosiverowth.Thusthecollaborationofthetwomaorpg,jme化odsbecomes也emainwayofspamfilteri打g.Thefirstlevelfil化ristouse化efirstmethodinorder1:0ursueafaskrrocessinseed.Businl:hesecondmethod,thesec
8、ondppgpyglevelfilt:ercouldursuehiherclassificationabilit.Thetwoasectsofl:hemainresearchpgypworkareasfoUowed:Intheareaoatter
此文档下载收益归作者所有