资源描述:
《基于比例特征的网络不良图像过滤系统的实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于比例特征的网络不良图像过滤系统的实现 基于比例特征的网络不良图像过滤系统的实现1绪论1.1选题背景及研究意义互联网给人们带来了资源共享的巨大便利,随着网络互连程度的不断扩大,Inter用户持续、快速的增加,人们接触互联网的频率越来越高,依照《中国互联网络发展状况统计报告》,截止到2014年底,国内的网民人数己高达7亿多,网络普及率己经超过50%,从中可以看出,网络对人们的影响力己经十分巨大但是,互联网是一把双刃剑,一方面,它为人民带来了利益;同时它也带来了很多不良信息,尤其是其中的色情信息严重影响了年轻人的身体和
2、精神健康、败坏了社会的风气。政治攻击目的和盈利目的是这些不良信息出现的两大原因,据统计,互联网每年新增图像数超过800亿,其中不良图像的比例居高不下,Inter上仅色情网站每天就有300-400个新的网站出现。为了配合法律手段打击这些行为,技术上的支持非常重要,因此如何检测出不良图像同时采取措施净化网络环境引起人们越来越多的重视[4]。网络不良信息包括文字、图片、音频和视频等,而不良图像过滤的定义,广义的说,一般指暴力、恶心、反动、色情、反人类等图片的过滤,本文中主要针对裸露程度很大的色情图像的过滤进行研究。.....
3、.....1.2研究现状相比于其他的图像检索等领域,不良图像的过滤系统它在两个方面都有严格的要求,一是高精度,如果发生漏判,会使过滤系统名存实亡,如果发生一个误判,将直接导致正常的用户信息被封锁,用它进行网络管理的话,它会侵犯用户合法权益;第二个要求是须有良好的实时性能,务必保证在不干扰网络正常运作的前提下,做到在线监测和过滤。因此,不良图像的检测技术一直处于不断的改进、优化之中,较常用的有肤色模型、纹理判断、人脸检测、姿态判断、肢体组合等方法但是因为一些不足之处使得其效果都不太理想,例如对于存在接近肤色的干扰色背景的
4、图片,混合肤色模型在选择阈值时会面临误判与漏判的两难局面;人脸检测识别率不够高;非关键区域肤色的干扰;整体裸露肤色比有时候不与裸露程度呈正相关的问题等等。这些年来,国内的研究人员对不良图像检测作了较多的研究,例如基于图像分割的,徐欣欣利用自适应小波不变矩判断是否有皮肤区域,在此基础上识别色情图像;基于纹理和颜色构成图像特征的,罗森林根据C4.5算法生成的皮肤判定规则检测敏感图像;朱教授等通过平衡算法得出颜色空间中的肤色区域特征,再利用SVM算法提取主要特征对图像进行分类,识别是否为色情图像;王溝茵在特征提取部分采用不确
5、定算法来提高准确度的基于直觉模糊一一神经网络的色情图像识别算法等等。在成型的系统方面,具有代表性的是东北大学软件中心提出的基于图像内容过滤的智能防火墙系统。该系统做到了基于语义的特征向量匹配。.........2相关技术和理论2.1网页处理技术要处理网页,首先要获取到相关的IE实例及其网页对象的接口,本文是利用操作系统Shell的两个组件:SHDocVent2Ptr指针主要对应着浏览器所浏览的内容。实现过程是先通过SHDocV对象赋给SHDocVent方法获得MSHTML::IHTMLDocument2Ptr指针对象,
6、之后便可以用其相关函数对所有的网页进行获取内容以及重定向等处理[n-i4]。由于MSHTML组件涉及到的操作较多,以下将先介绍MSHTML组件,然后介绍操作系统接口。MSHTML是Microsoft的LDocumentZ、、IHTMLDocument7等7种。其中,IHTMLDocument只有一个Script属性,是管理页面脚本用的;IHTMLDocument2接口跟C#的HtmlDocument类(即通过LDocument3是跟VisualBasic6.0里的文档对象相似的一个接口,基本上可以用到的方法都在其中。.
7、.........2.2数字图像处理本系统的主要功能在于图像分析模块,以下将先对数字图像处理原理与技术做一下总述,而后对系统中涉及的人脸检测技术、肤色检测技术、图像语义分析技术详细介绍。人从外界获取的信息中,大概有75%是来自于视觉系统的,即我们感知到的和学习到的内容大部分于图像。客观世界的景物在空间上经常是三维的,而一般情况下从客观世界获得的景物图像是二维的,因此一幅静态图像可用一个二维数组F(X,Y)来描述。这里X,Y表示的是二维空间中的一个坐标点,F表示该点(X,Y)形成的影像的某种性质。例如,对于没有颜色的灰度
8、图像,F表示的是该点的灰度值(亮度)。对于活动的图像,可以用F(X,Y,T)来描述。X,Y仍表示二维空间中的坐标,T表示时间。即活动的图像可看成由一系列时间序列上的静止图像组成,这样图像上各点的性质不仅与它的坐标位置有关,还与时间有关。对于彩色图像,可以用F(X,Y,L)来描述,其中L表示波长。因为反映到人眼的图像颜色由射入人眼的