信息检索系统日志建模探究

信息检索系统日志建模探究

ID:46364077

大小:65.50 KB

页数:6页

时间:2019-11-23

信息检索系统日志建模探究_第1页
信息检索系统日志建模探究_第2页
信息检索系统日志建模探究_第3页
信息检索系统日志建模探究_第4页
信息检索系统日志建模探究_第5页
资源描述:

《信息检索系统日志建模探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、信息检索系统日志建模探究[摘要]信息检索系统通过定制日志采集数据的方式,可以发现用户访问行为的特征及需求信息。重点研究信息检索系统中适用的定制日志建模理论和方法,通过业务建模、概念建模、逻辑建模和物理建模方法,发现建模过程中的规律和特点,通过在NSTL嵌入式系统中的实验,验证所提出的方法。[关键词]数据建模业务模型概念模型逻辑模型物理模型[分类号]G350TP3111引言在信息检索领域,越来越多的系统关注用户的访问行为,以提高用户访问体验。许多学者认为,Etzioni是第一个提出Web挖掘(Webmini

2、ng)技术的人,他在1996年的描述中认为,Web挖掘是应用数据挖掘技术,从Web文档和服务内容里自动发现并抽取有用信息。一般情况下,Web挖掘技术可以分为三种类型:Web内容挖掘(Webcontentmining)、Web结构挖掘(Webstructuremining)和Web使用挖掘(Webusagemining)oSrivastava等人对Web使用挖掘的定义是:Web使用挖掘是为了更好地理解和服务基于Web应用的需要,应用数据挖掘技术发现Web数据的使用模式。根据采用的数据挖掘算法不同,推荐系统有

3、三种类型:①基于关联规则(associationrulesfiltering)的过滤算法;②基于内容(content—basedfiltering)的过滤算法;③协作过滤(collaborativefiltering)算法。集成的Web个性化平台能够对网站的内容结构和Web用户行为进行分析,满足Web用户在线服务的需要。通过对服务器上的Web日志进行研究、总结规律,发现用户访问Web页面模式、访问行为、频度、内容和兴趣等信息,为以后提高网站服务质量、改进网站服务结构设计等决策和提供个性化服务提供实现的基础

4、。如何精确地捕获用户访问行为,正确地理解用户需求,提高数据质量,正在成为研究和应用领域的热点。定制日志方法不但提高了用户满意度和系统服务质量,而且提高了数据管理和使用效率。通过记录日志的方法,可以准确地捕获用户访问行为。但是,在日志中如何精确地体现用户访问行为,如何使日志记录系统在不影响系统性能的情况下,生成的日志数据能够符合结构化、规范化、一致性、简洁性、可扩展性、易操作性等要求,并满足多种应用需求的目标呢?为此,日志应记录什么样的内容成为研究的难点和重点。本文重点研究信息检索系统中,定制日志建模方法。

5、2日志建模2.1建模理论一般而言,数据模型可以分为三类:概念模型、逻辑模型、物理模型。其中,概念模型的目标是支持项目范围的整体视图;逻辑模型目标是呈现出每个数据元素的详细文档信物理模型目标是为数据库设计提供蓝本。在进行日志建模之前,要分析信息检索系统的业务模型,目的是描述企业管理和业务所涉及的对象和要素以及它们的属性、行为和彼此关系,业务建模强调以体系的方式来理解、设计和构架信息检索系统。2.1.1模型适用对象确定谁会使用所建立的日志模型以及生成日志数据的目的。使用日志数据的用户主要有两类:终端用户和后台

6、用户。2.1.2模型适用范围应该对不同的信息检索系统的用户对象和可访问的Web页面对象范围进行明确定义,主要考虑以下4个方面:①对系统的用户和Web页面对象有充分的认识,清楚有哪些用户、操作和对象;②围绕系统业务规则,清楚可能会用到的方法和步骤;③清楚用户、操作和对象的元素属性及其控制的业务规则;④限定系统适用范围。2.1.3建模业务规则信息检索系统的业务规则限定了用户对象、操作方法和操作对象的约束条件。这里面存在的业务规则限定了读者用户可以执行的操作和可访问对象。根据不同类型的信息检索系统,业务规则可以

7、划分为三类:①浏览性业务规则;②交互性业务规则;③协作性业务规则。•浏览性业务规则,主要限定用户可操作动作、可访问内容和对象。这种类型系统的业务规则有三个特征:①用户约束性弱;②点击性操作;③对象易理解。•交互性业务规则,主要限定用户类型、可操作动作类型和可访问内容和对象。这种类型系统的业务规则有三个特征:①用户类型约束性强;②可操作动作类型多样;③可访问的内容和对象受用户授权方式约束。•协作性业务规则,主要限定特定用户组、特定操作和特定任务。这种类型系统的业务规则有三个特征:①用户组约束性非常强;②可操

8、作动作有限;③任务限定性强。2.1.4建模方法通常,日志数据建模方法有两种:自顶向下和自底向上。•自顶向下法,是一种功能驱动,或者说是过程驱动的建模方法。采用自顶向下钻的方法,逐层递归实现每一层的细节描述。采用此方法进行日志建模时,应该充分理解日志数据的重要性,从以下三个方面考虑日志模型:①理解用户对日志数据的需求;②理解日志模型的重要性;③理解围绕数据的所有环境情况。作为日志数据建模者,采用此方法,应弄清两个问题:①系统应用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。