模糊理论在信息检索中的应用(人工智能).doc

模糊理论在信息检索中的应用(人工智能).doc

ID:59386350

大小:120.00 KB

页数:10页

时间:2020-06-01

模糊理论在信息检索中的应用(人工智能).doc_第1页
模糊理论在信息检索中的应用(人工智能).doc_第2页
模糊理论在信息检索中的应用(人工智能).doc_第3页
模糊理论在信息检索中的应用(人工智能).doc_第4页
模糊理论在信息检索中的应用(人工智能).doc_第5页
资源描述:

《模糊理论在信息检索中的应用(人工智能).doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、`无线网络技术课程(论文)题目:模糊理论在信息检索中的应用学生1:孟朋朋学号:130101062学生2:王磊学号:130101063所在系院:计算机工程学院专业班级:13计科2班指导教师:裴培职称/学位:助教硕士完成时间:2016年6月计算机工程学院制Word文档`摘要:模糊理论是为了解决真实世界中普遍存在的模糊现象而发展的一门学问。模糊理论以模糊集合为基础,基本精神是接受模糊性现象存在的事实,而以处理概念模糊不确定的事物为其研究目标,并积极地将其严密量化成计算机可以处理的信息。本文首先简介模糊理论,而后将模糊理论在信息检索上的应用做一探讨。希望通过本文,使大学对模糊理

2、论有更深入的了解,并且思考如何将之更广泛地应用于图书信息学上。关键词:模糊理论 模糊集合信息检索1.对模糊理论的一般解释基于康托经典集合论的精确数学要求:一个元素a和一个集合A的关系只存在a∈A和aA两种情况。集合可以通过特征函数描述,每个集合A都有一个特征函数CA(a),其定义用下式表示:1当a∈ACA(a)=0当aA该式表明,经典集合论容不得模糊概念。这对现实世界存在的大量模糊现象的解释造成困难。针对这一情况,美国自动控制专家查德(L.A.Zaden)于60年代初提出了“模糊集合”(Fuzzyset)概念。其基本出发点是用“隶属函数”概念来描述差异的中间过渡。这是首

3、次从精确性向模糊性的逼进。通过隶属函数对经典集合论中的特征函数加以推广,并由此引入了“模糊子集”概念。模糊子集定义如下:设给定论域u,u到闭区间[0,1]的任一映射μA为:μA:u→[0,1]确定u的一个模糊子集~A,μA为~A的隶属度。正如经典集合论是传统精确数学的基础一样,模糊子集论也正是模糊理论的基础,同样也可以定义模糊子集上的运算。总之,模糊理论可以将传统的二值逻辑{0,1},推广至可取[0,1]闭区间任意值即无穷多个值的连续值逻辑。Word文档`2.信息检索中引入模糊理论的必要性2..1传统信息检索方法存在的问题2.11通过检索语与索引语的精确匹配来进行检索,

4、只能检索到二者完全相同的信息。传统的信息检索以精确数学、普通的集合理论为基础,检索系统主要基于三种经典检索模型:布尔模型、向量空间模型和概率模型。这三种模型的检索过程是通过检索者输入的关键词(或称检索语)与信息所登录的关键字(或称索引语)之间的精确匹配来完成的,只能检索到检索语与索引语完全相同的信息,而对于二者在一定程度上一致或意义相近、相关的信息却无法查询。2.12传统的检索方式中检索者虽然可以利用检索语之间的逻辑运算及其组合来表达检索要求,但却无法描述检索者对检索语的重视程度以及检索语对信息是否贴切等许多问题。2.13只能对一些具有确定含义的信息进行访问和处理。在客

5、观世界中,许多事物都表现出其不完全或不精确的一面,例如,我们常说的“高与矮”、“胖与瘦”、“美与丑”,这些词都是属于模糊概念,既难以准确地加以度量,也难以明确地划分界限。在检索此类信息时传统的检索方法无法进行。2.2信息发展的模糊性2.21信息的模糊性现代科学技术的发展及其渗透,许多新兴学科、边缘学科、交叉学科不断涌现,使学科的分类呈现出模糊性。如“生物电子学”,它既涉及到生物学畴,又与电子学有关,在对文献进行学科分类时,只能根据文献对这两门学科的侧重点多少来大概划分是属于生物学还是属于电子学方面。在情报学畴,学科分类的模糊性必将反映到分类法和叙词表中,使分类类目和叙词

6、表达围变得模糊。因此,随着科学技术的发展,信息也呈现出模糊性。2.22信息检索结果评判的模糊性我们经常用“文献是否相关”、“文献是否切题”来对信息检索的结果进行评判,相应的“相关性”、“切题性”也就成了评判信息检索结果的两个重要指标。“相关性”Word文档`是指信息检索时检索系统中被命中文献与用户需求文献相吻合的程度。文献的相关与不相关不是绝对的,它本身就是模糊的,且它们之间没有明确的界限。对用户来说,由于受多种因素(比如表达信息要求不完整,或表达不够明确,或在检索过程中对所需信息有所调整等)的影响,检索出的文献与实际需求只有一定程度的主题相关。而用户检索出的相关文献并

7、不一定意味着所检文献与用户的需求相吻合。信息需求与文献相符的性质称为切题性。切题性体现了用户在作判定时,文献满足用户需求的程度,是否切题只有在用户阅读后才能确定。其原因在于:提问一般是固定不变的,而信息需不稳定的、可变的。在检索过程中,用户阅读已获文献可能会影响他原来的信息需求,从而影响他对后来检索出文献的切题性判断。因此,判断文献是否切题也没有严格的界限,它更具模糊性、主观性。3.模糊理论在信息检索中的应用针对传统信息检索方法存在的问题和现代信息发展的特点,许多学者对如何利用模糊集合理论来完善和改进信息检索方法做了大量的研究,使检索效果

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。