基于行为模式进行网络搜索信息过滤

基于行为模式进行网络搜索信息过滤

ID:27107751

大小:50.00 KB

页数:4页

时间:2018-12-01

基于行为模式进行网络搜索信息过滤_第1页
基于行为模式进行网络搜索信息过滤_第2页
基于行为模式进行网络搜索信息过滤_第3页
基于行为模式进行网络搜索信息过滤_第4页
资源描述:

《基于行为模式进行网络搜索信息过滤》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于行为模式进行网络搜索信息过滤对大量信息样本进行的统计、分析和计算,建立行为模式数学模型,利用这种具有极高行为特征的模型,对新的信息进行分析判定。    2.2数据挖掘  数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。这些信息是可能有潜在价值的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。  对于垃圾信息行为模式进行信息挖掘,主要是针对相关dash;主元分析,这种方法可以有效的找出数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。

2、它的优点是简单,而且无参数限制,可以方便的应用与各个场合。利用主元分析技术对于垃圾信息的不同行为模式,利用应用线形代数知识进行科学求解,最大程度去掉冗余和干扰,找到垃圾信息的主要行为模式。    2.4基于行为模式的垃圾过滤模型  通过行为模式识别技术对网络搜索结果中的垃圾信息进行过滤,其思想是对大量垃圾信息样本进行分析,建立垃圾信息行为特征模型,利用这个特征模型对搜索的结果信息进行分析、判断,过滤其中的垃圾信息。整个垃圾信息过滤模型,基于信息知识智能理论指导,采用数据挖掘方法提取垃圾信息的行为规则,从而

3、建立垃圾信息过滤模型。信鼠表示事物状态变化方式,知识表示事物状态变化规律,智能表示根据已知事物变化规律指定对未知事物检测的规则。  智能模型建立步骤:  首先大量收集不同搜索结果中包含的垃圾信息;根据Inktomi对垃圾信息定义对搜索的信息进行分类整理,并进行垃圾信息预处理,通过数据格式和内容调整使数据更符合数据挖掘的需要;根据数据挖掘算法对垃圾信息行为模式进行挖掘;利用主元分析理论,对垃圾信息的行为特征进行计算分析,找到数据中最主要的元素和结构;将垃圾信息的主要行为进行知识表示;从生成的知识中生成求解问

4、题的策略和规则;利用生成的策略和规则建立垃圾信鼠过滤模型,从而解决所面对的实际问题。  建立模型需要解决的关键问题:  垃圾信息的收集是否全面,能否采集到准确,真实的数据来是研究基础;垃圾信息中得到的数据适应性,是否能对这一类垃圾信息真实全面反应;对垃圾信息的行为模式进行数据挖掘时采用的算法;提取垃圾信息各种行为中的主要元素的方法;对垃圾信息的行为模式特征的分析,产生垃圾信息过滤的规则集。    3 信息过滤系统    如图1所示,为信息过滤系统结构图,在原有的网络搜索引擎系统中,通过将文本索引中包含的索

5、引信息发送给过滤服务器,通过索引信息中链接查询相关WEB,分析该WEB的行为特征,与垃圾信息行为特征库中不同类型的垃圾信息的行为特征进行比较,清理掉被判定为垃圾信息的搜索结果信息,将正常行为信息存入索引数据库。  其中,过滤服务器需要完成4方面的工作,包括信息采样、行为解析、特征比较、信息过滤。信息采样:提取文本索引中的信息,包括链接,文本信息等信息。行为解析:对不同信息进行分析,提取主要行为特征。特征比较:将不同.擎结构,相对独立,易于升级维护。搜索结果相对公平:由于过滤系统相对独立,可由第三方开发商设

6、计指定,避免网络搜索提供商出于自身利益等考虑而为用户提供的搜索结果。节省用户信息搜索时间:由于垃圾信息减少,节省了用户需要大量打开不同链接查询信息的时间。先进的过滤技术:传统采用内容关键字过滤时,由于某些网站随意修改关键词内容,这样原有的词库不能找到匹配的关键词,从而无法过滤垃圾信息,而行为模式识别技术从垃圾信息的特征行为进行判定,即使进行了关键词内容修改仍可以判定垃圾信息。    5 总结    搜索结果中的垃圾信息,对于用户和搜索引擎自身都带来了极大的负面影响,传统的信息过滤技术已经不能满足对垃圾信息

7、的过滤,通过先进的行为模式识别技术来设计过滤系统,可以增加垃圾信息过滤的准确性,提高搜索结果的正确性,从而满足用户对信息获得的要求。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。