资源描述:
《安全搜索引擎中访问控制策略地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要Internet上的信息绝大部分都包含在web页中。而在内部网中,信息(数据和内容)分散在web页、数据库、邮件服务器或者其他协作软件、文档库、文件服务器和桌面中。内联网搜索引擎必须能够通过同一接口搜索企业的web内容、应用程序、数据库和邮件。全面、可跨结构化和非结构化数据源以及能够搜索每个角落(深层内联网)是内部网搜索的要点。内部网搜索引擎必须能够实现安全性。如果用户没有被授予查看文档、电子邮件或记录的权限,则甚至该记录是否存在也不应让其知道。访问权限可以更改,并且对不同基础信息存储所作的权限更改必须迅速
2、传播到搜索引擎。对Web搜索引擎的四个主要功能模块:爬行,索引,检索,排序等做了深入的研究。研究了当前搜索引擎的发展现状,访问控制的主流技术,以及现有Web系统中的访问控制策略,对企业搜索引擎的发展做了归纳和总结,并给出了安全搜索引擎在功能和性能上的需求。结合当前内部网站访问控制的现状,给出了实现搜索引擎访问控制的两种策略:索引过滤策略和检索过滤策略,通过对两种策略的分析和比较,选择索引过滤策略作为实现安全搜索引擎访问控制的策略。给出了安全搜索引擎中实现访问控制的总体设计思路,并详细介绍了各个功能模块的设计。最
3、后结合总体设计思路,给出了安全搜索引擎实现的总体架构,以及各个功能模块的具体实现。实验结果显示,使用上述方法实现的系统满足安全搜索引擎在功能和性能上的要求。关键字:搜索引擎,安全搜索,访问控制,安全索引IAbstractInformationontheInternetconsistsoverwhelminglyofwebpages.IntheIntranet,information–dataandcontent–isspreadacrosswebpages,databases,mailserversorothe
4、rcollaborationsoftware,documentrepositories,fileservers,anddesktops.AnIntranetsearchenginemustbeabletosearchanorganization’swebcontent,itsapplications,databases,andmailthroughthesameinterface.Comprehensiveness,acrossstructuredandunstructuredsources,andabilit
5、ytoreacheverycorner(thedeepIntranet)isthekeytoIntranetsearch.AnIntranetsearchenginemustbeabletoenforcesecurity.Ifauserisnotauthorizedtoseeadocument,emailmessageorrecordtheneventheexistenceoftherecordshouldnotbevisibletohim.Theaccessrightscanchange,andaccess-
6、changesmadetothedifferentunderlyinginformation-storeshavetobepropagatedtothesearch-enginequickly.Thisthesisdoesanin-depthstudytofourmainfunctionmodulesofwebsearchengine:crawl,index,searchandsort.Researchinthecurrentsearchenginedevelopmentstatusincludsthemain
7、technologyofaccesscontrolandtheaccesscontrolstrategyinthecurrentwebsystem.Summarizingthedevelopmentofenterprisesearchengine,thethesissumsuptherequirementoffunctionalandperformanceinsearchengine.Combiningwiththecurrentstatusofinternalwebaccesscontrol,twostrat
8、egiesofrealizingsearchengineaccesscontrolareproposed:theindexfilterbasedstrategyandsearchfilterbasedstrategy.Byanalysisingandcomparingthetwostragies,theindexfilterbasedstrategyisbettertothesecur