欢迎来到天天文库
浏览记录
ID:53029597
大小:622.45 KB
页数:5页
时间:2020-04-14
《基于数据仓库的数据搜索引擎实践-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、S业n基于数据仓库的数据搜索引擎实践栾晓宇(上海烟草集团有限责任公司上海200082)摘要针对现有数据仓库中数据种类多、应用多、指标多的情况,本文提出一种针对数据仓库的搜索引擎应用的信息技术架构,以实现对数据仓库中的应用、报表和数据的搜索功能。本文详细介绍了数据仓库搜索引擎的设计框架与工作流程,介绍了如何对业务语言进行解析,并介绍了如何对搜索的结果进行匹配度判定。关键词搜索引擎,数据仓库,业务语言解析,文档索引doi:10.3969d.issn.1674—7933.2015.03.006PracticeonSe
2、archEngineBasedonDataWarehouseLUANXiaoyu(ShanghaiTobaccoGroupCo.,Ltd.Shanghai200082,China)AbstractIntheviewofthenumerousdatatypes.applicationsandindexesindatawarehouse.thepaperintroducesaninformationtechnologyarchitectureofasearchenginebasedONdatawarehouse.w
3、hichaimstosuppo~thesearchfunctioninapplications,repotsanddata.thispaperelaboratesthedesignframeworkandoperationalproceduresofsearchengine.iIlustratesthewaytoanalyzebusinessIanguageandalsointroduceshowtojudgethematchingdegreeofsearchresults.KeyWordsSearchEngi
4、ne,DataWarehouse,BusinessLanguageAnalysis,DOCUmentIndex0引言库和安全级别的搜索引擎,基于对企业定制搜索引擎所面临的搜索需求的理解,企业定制搜索引擎的主要需求伴随着无纸化办公和信息技术的不断发展,特别是如下。互联网应用的迅速普及和应用,各行各业在各自的信息1)对企业内部结构化数据的搜索。大部分企业的内系统中形成了一个庞大的信息库,如果要在如此浩瀚的部搜索需求是为了要知道企业内部的某个数据或者指标海洋里寻找信息,就像“大海捞针”一样。能有一种工的情况,主要偏重
5、于对结构化信息的搜索与定位。考虑具可以帮助我们在极少的时间内就能够迅速找到我们想到一般用户在搜索数据的时候基本都是搜索汇总后的数要的信息内容吗?答案就是搜索引擎。如今,搜索引擎据,所以企业如果建立了自己的数据仓库,那么在实现已成为人们在生活和工作中必不可少的利器。搜索引擎时会节省较多的时间。除了日常生活和工作中常用的搜索应用,如百度、2)对企业所使用的术语的理解。这是企业内部搜索谷歌等,针对企业自身的搜索引擎的需求也越来越多,的最大特点,也是企业内部搜索引擎必须解决的问题,企业内部使用搜索引擎除了需要实现通用型
6、搜索引擎的既然是企业内部使用,那么绝大部分的用户在使用的时功能以外,还需要针对不同的业务领域,定制不同信息候会以业务名词作为主要的关键字,所以对业务语言的解析成为企业搜索引擎建设的一个关键点。作者简介:栾晓宇,男,1971年生,工程师,主要事殁研究领域:计算机信息技术,Email:luanxy@sh.tobacco.com.cn/xyluan@sina.corn。3)对企业信息的安全等级的要求。这是基于对企业S—。.。..。。索内部信息保护的需求,与普通的搜索应用不同,企业的在控制层主要包含搜索解析引擎、信息查
7、询引擎、搜索引擎一定要与企业内部的权限机制结合,才能够保元信息维护引擎三个组成部分。证企业的敏感信息只有拥有权限的用户才能看到。1)搜索解析引擎。负责接收用户以业务语言形式输本文设计了_一套基于企业数据仓库的信息处理机制入的查询条件,对该查询条件进行有效的分解,通过分相应的搜索引擎,针对不同的业务领域和用户提供检索服词、词法分析、语法分析、语义解释等过程,对搜索信务,实现领域信息的专业化管理和提高信息安全级别。息库进行检索,生成符合查询条件的检索结果集,供用本文通过介绍数据仓库搜索引擎的设计框架、工作户进行进一
8、步的选择【1]。原理、如何对数据仓库搜索引擎元信息的整理以及检索例如,用户输入的查询条件为“2013年上海卷信息的处理展现,满足不同业务领域用户的搜索需求,烟销量”,通过搜索解析引擎将被解析成为:时间以数据仓库为背景建立的数据仓库搜索引擎,并提供信维度=“2013年”,产品维度=“上海”,查询指标息智能抓取处理引擎和移动化办公的搜索引擎系统。=“销量”;同时还会被解析成第二种含义:时间
此文档下载收益归作者所有