欢迎来到天天文库
浏览记录
ID:34474096
大小:189.16 KB
页数:3页
时间:2019-03-06
《internet网络安全的信息过滤模型分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第33卷第3期电子科技大学学报Vol.33No.32004年6月JournalofUESTofChinaJun.2004Internet网络安全的信息过滤模型分析张选芳(中国民航飞行学院计算机与信息工程系四川广汉618307)【摘要】当前,由于Internet应用的逐渐普及,WWW已经成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。如何快速、准确得到确定领域中的信息,使信息过滤成为Internet网中关注的热点。基于此,该文分析了信息过滤中常用的向量空间模型、布尔逻辑模型和潜在语
2、义索引三种信息过滤模型,以及存在的问题,在此基础上推出了一种准确度更好的模糊集合的信息过滤模型。关键词Internet网;网络安全;信息过滤;模糊集合中图分类号TP393文献标识码AAnalysisofInformationFiltratingModelofInternetSecurityZhangXuanfang(DepartmentofComputerandInformationEngineering,ChinaAviationFlightCollegeSichuanGuanghan6183
3、07)AbstractNowadays,Internetismoreandmorewidelyused.WWWhasbeenalargelydistributedinformationspaceandprovidedavaluableinformationresourceforusers.HowgettheinformationrapidlyandaccuratelymakesinformationfiltratingbecomethefocusofInternet.Basedonthese,t
4、hepaperanalysisthevectorspacemodel,Booleanlogicmodelandthelatentsemanticindexmodelincommonuseintheinformationfiltratingandproblemsinexistence.Andthepaperpresentsanaccurateandbetterinformationfiltratingmodelbasedontheblurmuster.KeywordsInternetnetwork
5、;networksecurity;informationfiltrating;blurmuster随着网络通信技术的发展和普及,在Internet网上涌现出的各种数据为各种用户提供了一个极具价值的信息源。但是,基于Internet网所固有的开放性、动态性和异构性,使用户很难准确快捷地从WWW上获取所需信息。这就需要根据用户的个性兴趣,在浩如烟海的动态信息中过滤掉无用信息,把所得到的不相关信息减至最小。目前,信息过滤成为当前重要的研究课题,其基本思想是从动态信息源中过滤掉比较固定的非需求信息,方法
6、是通过代理服务器加入内容过滤功能,对内可以消除通过网页机密造成的泄漏;对外[1]可以过滤掉网页中的无用信息。信息过滤要求过滤的内容性和实时性,这两性指明了评价信息过滤模型优劣的标准是过滤精度和过滤速度。匹配算法的速度是决定信息过滤速度的因素之一,它通常由基本的过滤[2][3]模型所决定,目前常用的基本信息过滤模型主要有:向量空间模型,布尔逻辑模型,潜在语义索引模型[4]。这三种模型的出现使信息过滤的查准率、查全率及效率都大有提高。然而,它们之间存在着各自的缺陷。为此,本文将在对三种模型比较的基础
7、上讨论模糊集信息过滤模型。1三种信息过滤模型分析1.1向量空间模型在向量空间模型构造的信息过滤系统中,习惯使用字项来标识文档。如:一个包含不健康信息的文档D,收稿日期:2004−03−03作者简介:张选芳(1950−),女,副教授,主要从事数据库应用和网络通信等方面的研究.第3期张选芳:Internet网络安全的信息过滤模型分析271用一个m维向量来表示,其中m是能够用来表示文档内容的字项的总数。给每一个字项赋予一个权值,用来表明它的重要程度。该文档D的向量表示为D=(w1,w2,…,wm)(1
8、)式中wi表示第i个字项的权植。在进行信息过滤的过程中,首先对请求的页面数据进行加工,将其看成是一个由n个词组成的向量P,然后比较向量P和向量D的相似程度nnn22sim(C,D)=cosθ=C⋅DC⋅D=∑uw∑∑uw(2)iiiii=1i==11i由上式知,若两向量的夹角变小,则相似程度随余弦值而变大,待过滤文本符合过滤需求的可能性增加。设定过滤阀值ψ,当sim(C,D)≥ψ,其D所对应的内容符合过滤需求,应禁止在网络中传输和扩散。1.2布尔逻辑模型布尔逻辑模型是一种相对简单的模型,原理是给
此文档下载收益归作者所有