不原创精品良网页判定算法的研究与实现

不原创精品良网页判定算法的研究与实现

ID:41741544

大小:59.56 KB

页数:9页

时间:2019-08-31

不原创精品良网页判定算法的研究与实现_第1页
不原创精品良网页判定算法的研究与实现_第2页
不原创精品良网页判定算法的研究与实现_第3页
不原创精品良网页判定算法的研究与实现_第4页
不原创精品良网页判定算法的研究与实现_第5页
资源描述:

《不原创精品良网页判定算法的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、不良网页判定算法的研究与实现赖勇浩(计算机科学与技术师范专业)指导老师:谢赞福副教授摘要:不良网络信息过滤是一个切合社会迫切需求,应用面极广,体现大学生社会责任感的极具商业价值的课题,是人工智能与数据挖掘相关技术的综合性应用,其最垂要组成部分是对网页性质的判定•本文的不良网页判定算法对文本和图像这两个最重耍的网页组成元素进行检测分析,由软件系统自行判定网页是否包含色情,暴力,反动等不良信息.提出了基于学习型知识库的文本内容检测分析算法和反误判算法,综合了基于肤色模型和人脸特征的图像检测算法,建立文木与

2、图形结合的数学模型,创造性地将文木与图像两面结合起来判定网页的性质,极大地提高了识别率,降低了误识率.在已经实现的过滤系统一一《上帝Z手》上,对不良网页的识别过滤率高达99.2%・关键字:不良信息过滤判定算法识别文本检测ResearchandImplementationofJudgingBadWebPagesAlgorithmYonghaoLaiDirectedby:ProfessorZanfuXieAbstract:Badnetworkinformationfilterisacommercially

3、valuabletaskthatsuitstotheexigentrequirementofthesocietyandhasahugeapplication.ltadequatelyincarnatesthesocialresponsibilityoftheundergraduates.ltisacorrelationtechniqueall-aroundapplicationofArificialIntelligenceandDataMining.Themostimportantingredient

4、isthejudgementtothewebpageproterty.Judgingbadwebpagesalgorithmofthispassageisadetectinganalusistowardstotextandimage,whicharethemostimportantcomponentelementofwebpages.Thissoftwaresystemitselfjudgesthewebpageswhethercontainsthewebinformationsuchaserotic

5、ism,violenceandcounteraction.Suggestthealgorithmofdetectingtextcontentbasedonstudyingrepositoryandanti-misdetectingalgorithm.Bindtheimagedetectomgalgorithmwhichbasedoncomplexionmodelandfacefeature,eatablishthemathematicalmodelwhichbindtextandimage,creat

6、ivelyjudgepropertyofthewebpagesbydetectingtextandimage,infinitelyimprovetherecognitionrate,reducetheanti-missingrate.Inourfiltersystem-GODfSHANDjhereconitionratetobadwebpagehavebeenupto99.2%.Keywords:informationfilterJudgingbadwebpagesalgorithm5Recognit

7、ion,Textdetecting.引言中国互联网业形成声势也就5年时间,但形象和境况却已变幻多次,互联网会在短短2〜3年Z间迅速“变色”。以短信为契机,互联网已经成为色情/暴力/反动的主战场•一切正在往相反的方向加速滑行,越来越“黄”,越来越“黑”,形成恶性循环,失去了界限,使得互联网的主力——青少年成为主要的受害者。由于高匿名性、高隐私性、高互动性和无地域性等特点,使得成人内容根本无法有效管理和制约。对青少年的侵害,远比不良的网络游戏危害更人、更严重。令人担忧的是,我们传统的监管法规、技术手段乃至

8、对网络色情业的认知都还停留在初级阶段。于是便也使得许多家长学校视互联网为洪水猛兽,强行禁止,使得互联网的信息传播和资源共享等等优点都被掩盖,家长、学校的介入保护行为也等于关掉了一个广袤的天地。扼腕叹息Z余我们别无选择。面对这一两难的问题,我们该怎么办?“我们该怎么办?”针对这一深具社会责任感的课题,配合自2004年未开始的''净网行动",我们开发了《不良网页过滤引擎一一上帝之手》,希望借助它来净化我们的网络,还给我们一片纯洁的天空。《上帝Z手》采用COM

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。