欢迎来到天天文库
浏览记录
ID:22080358
大小:58.00 KB
页数:8页
时间:2018-10-27
《人工智能在跨语言信息检索中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、人工智能在跨语言信息检索中的应用人工智能是计算机科学的一个分支,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学,在许多科学领域都获得了广泛应用,X络信息检索就是其中一个非常重要的应用。文章介绍了信息检索的基本概念和人工智能的常用方法,指出跨语言检索已越来越成为信息检索的一个重要方向;对跨语言检索的实现模式、语言学资源、实现的关键技术问题进行了阐述;并展望了人工智能领域的发展前景。0引言人工智能(ArtificialIntelligence)是当前科学技术发展中的一门前沿学科,是在计算机科学、控制论、信息论、神经心理学、语言学等多种学科基础上发
2、展起来的一门综合性很强的边缘学科。它是研究机器模拟人的大脑所从事的感觉、认知、记忆、学习、联想等思维活动,解决人类才能处理的复杂问题,实质上是模仿人的大脑而展开思考[1]。目前,人工智能技术已经应用在许多方面,而信息检索(InformationRetrieval)就是其中的一个重要应用。1信息检索系统概述人类解决问题的方法之一就是不断地尝试,即逐个地检验可能解决问题的每个方法,直至找到一个可行的方法为止。但是这种盲目的搜索法,随着问题规模扩大,可能组合的数量也就增长的越大,“组合爆炸”效应使得这种方法并不能解决大而复杂的问题。完整的信息检索应包括信息的存储和检索两个过程,主要针
3、对的是单一语种的文档集,其查询语言通常为单一语种。而如今的趋势是人们所面对的信息资源不再是单一语种,而是用不同语言表达的信息汇聚在一个集合中。因而多语言问题日益成为信息共享的一个主要障碍,基于此,跨语言检索则成为解决这一问题的一个最佳方案[2]。2人工智能的基本方法人工智能就是为了帮助人们更快的解决问题,它包括两方面:对于确定性事物的判断和对于不确定性事物的判断,它的主要方法包括以下几种。2.1启发式搜索不断地尝试各种方案的准确性,对各种可能性进行反复测试,直到找到合适的解决方案,是人们常用的方法。常用的搜索策略有盲目搜索和启发式搜索。盲目搜索是按顺序测试各种方案的可行性;而启
4、发式搜索则可以根据经验和启发式信息进行搜索,对希望不大的搜索方向就直接摒弃掉。启发式搜索可以利用问题本身的定义,还可以利用与问题有关的一些特定的知识进行搜索,因而可以找到更有效的解决方案,大大缩短了搜索过程。2.2智能规划智能规划主要是面向实际问题,基本思想是:对周围环境进行认识与分析,根据要实现的目标,对若干可供选择的动作及所提供的资源限制施行推理,综合制定出实现目标的规划。规划要依靠启发式信息,成功与否,很大程度上决定于启发信息的可靠程度。而智能规划问题的操作的前提之间也存在着很强的依赖与冲突关系,即一个操作的使用常常使另一个操作无法执行,甚至导致最终目标无法实现。因此,在
5、智能规划中也要考虑如何避免操作间的冲突。智能规划目的是建立起高效实用的智能规划系统。该系统的主要功能可以描述为:给定问题的状态描述、对状态描述进行变换的一组操作、初始状态和目标状态。智能规划系统能够给出从初始状态变到目标状态的一个操作序列,其复杂性和所处的环境以及Agent的功能有关。2.3知识的表达技术知识及其表达是计算机科学中智能程序设计研究的主要领域,也是人工智能领域关心的基础性问题。知识表达(KnoationRetrieval,CLIR),是指用户以一种语言提问,检出另一种或几种语言描述的信息资源的信息检索技术和方法。跨语言信息检索中,用户用以表达自己的信息需求,构造检
6、索提问式的语言称为源语言(SourceLanguage),被检索的信息资源所使用的语言称为目标语言(TargetLanguage)。而要实现语言之间的转换,首先要使计算机能理解自然语言文本的意义,然后能以自然语言文本来表达给定的意图、思想等。例如自动识别一份文档中所有被提及的人与地点;识别文档的核心议题;在一堆仅人类可读的合同中,将各种条款与条件提取出来并制作成表;或者通过精心选定的某些特征和文本中的某些元素结合来识别一段文字,通过识别这些元素可以把某类文字同其他文字区别开来,比如垃圾邮件同正常邮件等等。跨语言信息检索是在对自然语言理解的基础之上,其关键问题是要使查询语言与文档
7、语言在检索之前达成一致。使用户以一种语言提问,可以检索出另一种语言或多种语言描述的相关信息。例如,输入中文检索式,跨语言检索系统会返回英文、日文等语言描述的信息,而且这些信息不仅仅是文本信息,还可以是其他形式的信息。3.1智能技术在跨语言检索的实现模式人工智能技术在信息检索系统的广泛应用,是人工智能技术与信息技术的成功结合的结果。在跨语言检索中,提问式所用的源语言一般是用户的母语,而被检索的文档所使用的目标语言,一般是用户不熟悉甚至完全陌生的语言。目前跨语言检索的主要实现方法有提问式翻译方法
此文档下载收益归作者所有