internet网络安全的信息过滤模型分析

internet网络安全的信息过滤模型分析

ID:34474096

大小:189.16 KB

页数:3页

时间:2019-03-06

internet网络安全的信息过滤模型分析_第1页
internet网络安全的信息过滤模型分析_第2页
internet网络安全的信息过滤模型分析_第3页
资源描述:

《internet网络安全的信息过滤模型分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第33卷第3期电子科技大学学报Vol.33No.32004年6月JournalofUESTofChinaJun.2004Internet网络安全的信息过滤模型分析张选芳(中国民航飞行学院计算机与信息工程系四川广汉618307)【摘要】当前,由于Internet应用的逐渐普及,WWW已经成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。如何快速、准确得到确定领域中的信息,使信息过滤成为Internet网中关注的热点。基于此,该文分析了信息过滤中常用的向量空间模型、布尔逻辑模型和潜在语

2、义索引三种信息过滤模型,以及存在的问题,在此基础上推出了一种准确度更好的模糊集合的信息过滤模型。关键词Internet网;网络安全;信息过滤;模糊集合中图分类号TP393文献标识码AAnalysisofInformationFiltratingModelofInternetSecurityZhangXuanfang(DepartmentofComputerandInformationEngineering,ChinaAviationFlightCollegeSichuanGuanghan6183

3、07)AbstractNowadays,Internetismoreandmorewidelyused.WWWhasbeenalargelydistributedinformationspaceandprovidedavaluableinformationresourceforusers.HowgettheinformationrapidlyandaccuratelymakesinformationfiltratingbecomethefocusofInternet.Basedonthese,t

4、hepaperanalysisthevectorspacemodel,Booleanlogicmodelandthelatentsemanticindexmodelincommonuseintheinformationfiltratingandproblemsinexistence.Andthepaperpresentsanaccurateandbetterinformationfiltratingmodelbasedontheblurmuster.KeywordsInternetnetwork

5、;networksecurity;informationfiltrating;blurmuster随着网络通信技术的发展和普及,在Internet网上涌现出的各种数据为各种用户提供了一个极具价值的信息源。但是,基于Internet网所固有的开放性、动态性和异构性,使用户很难准确快捷地从WWW上获取所需信息。这就需要根据用户的个性兴趣,在浩如烟海的动态信息中过滤掉无用信息,把所得到的不相关信息减至最小。目前,信息过滤成为当前重要的研究课题,其基本思想是从动态信息源中过滤掉比较固定的非需求信息,方法

6、是通过代理服务器加入内容过滤功能,对内可以消除通过网页机密造成的泄漏;对外[1]可以过滤掉网页中的无用信息。信息过滤要求过滤的内容性和实时性,这两性指明了评价信息过滤模型优劣的标准是过滤精度和过滤速度。匹配算法的速度是决定信息过滤速度的因素之一,它通常由基本的过滤[2][3]模型所决定,目前常用的基本信息过滤模型主要有:向量空间模型,布尔逻辑模型,潜在语义索引模型[4]。这三种模型的出现使信息过滤的查准率、查全率及效率都大有提高。然而,它们之间存在着各自的缺陷。为此,本文将在对三种模型比较的基础

7、上讨论模糊集信息过滤模型。1三种信息过滤模型分析1.1向量空间模型在向量空间模型构造的信息过滤系统中,习惯使用字项来标识文档。如:一个包含不健康信息的文档D,收稿日期:2004−03−03作者简介:张选芳(1950−),女,副教授,主要从事数据库应用和网络通信等方面的研究.第3期张选芳:Internet网络安全的信息过滤模型分析271用一个m维向量来表示,其中m是能够用来表示文档内容的字项的总数。给每一个字项赋予一个权值,用来表明它的重要程度。该文档D的向量表示为D=(w1,w2,…,wm)(1

8、)式中wi表示第i个字项的权植。在进行信息过滤的过程中,首先对请求的页面数据进行加工,将其看成是一个由n个词组成的向量P,然后比较向量P和向量D的相似程度nnn22sim(C,D)=cosθ=C⋅DC⋅D=∑uw∑∑uw(2)iiiii=1i==11i由上式知,若两向量的夹角变小,则相似程度随余弦值而变大,待过滤文本符合过滤需求的可能性增加。设定过滤阀值ψ,当sim(C,D)≥ψ,其D所对应的内容符合过滤需求,应禁止在网络中传输和扩散。1.2布尔逻辑模型布尔逻辑模型是一种相对简单的模型,原理是给

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。