结合编辑距离和google距离的语义标注方法研究

结合编辑距离和google距离的语义标注方法研究

ID:22388773

大小:1.67 MB

页数:50页

时间:2018-10-28

结合编辑距离和google距离的语义标注方法研究_第1页
结合编辑距离和google距离的语义标注方法研究_第2页
结合编辑距离和google距离的语义标注方法研究_第3页
结合编辑距离和google距离的语义标注方法研究_第4页
结合编辑距离和google距离的语义标注方法研究_第5页
资源描述:

《结合编辑距离和google距离的语义标注方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文1绪论义标注方法,并详细介绍了该方法的标注过程和主要的功能模块。此外,由于传统语义标注工具几乎无法对word格式的文档进行直接语义标注,所以文中还阐述了如何对本文的标注方法进行改进,从而实现对word文档的标注。第五章介绍了基于编辑距离和Google距离的语义标注方法在葡萄酒领域的应用,分别针对领域内的网页文档和word文档设计了实验的系统框架,并将本文方法的标注结果与GATE的标注结果进行对比和详细分析,证实了本文方法的有效性。第六章对全文进行了简单的总结和概括,并对下一步要做的工作进行了展望。4重庆大学硕士学位论文2语义W

2、eb和本体2语义Web和本体2.1语义Web简介2.1.1语义Web的起源和思想随着Web上信息量的膨胀,人们越来越深刻地意识到正面临这样一个处境:尽管Web上有海量的信息,但“知识”却很贫乏,以致无法有效地利用这个巨大的知识库。为此,“万维网之父”TimBerners-Lee提出了语义Web的概念,以解决当前Web存在的一些问题,使Web更有效地为人类服务。根据TimBerners-Lee的观点[1],语义Web是当前Web的延伸和扩展,而不是一个新的Web,它面向文档中所表示的数据,其中的信息被赋予了明确的语义,有利于计算机理解和处理数据,从

3、而使机器和人能更好地协同工作。换句话说,语义Web是对当前万维网的根本变革,它提供了一个通用的框架来对现有Web进行扩展。其核心思想是通过增加语义信息,让计算机参与到自动处理Web信息的过程,改变它在Web中的角色,使其可理解Web上的信息,使Web应用具有一定的智能,从而实现信息的自动化和智能化处理,这也是语义Web发展的终极目标。在语义Web环境下,信息通过本体以及与本体一致的元数据以结构化的形式描述,并定义了良好的语义。计算机可以根据含有语义信息的标签进行逻辑推理,发现并理解数据的语义,从而进行深层次的智能判断和决策,让不同主体能在语义层面

4、上进行交流。语义Web与传统Web最大的不同在于:传统Web主要存储和共享文本、图像、音频、视频等,这类数据主要供人类浏览和阅读,起着展示信息的作用,由于仅仅关注信息的表示方式,忽略了计算机处理信息的作用,使得很多智能应用无法在Web上实现。对于计算机而言,这类数据只是Web上的一堆二进制代码,而却无法识别其中的内容,这在很大程度上限制和约束了Web的发展。因为只有当Web成为一个能理解信息的语义,与人类共享Web信息的平台,它的巨大潜能才能发挥到极致。当然,计算机可理解的语义信息并不是指计算机真正的理解人类语言,而是指计算机可以根据明确定义的语

5、义,执行明确指示的操作命令来解决具体的问题。处于不同平台中的数据,可以被计算机自动处理,并进行有效地重用和集成,使网络能够提供自动化、智能化和个性化的服务。由此可知,对语义Web研究的主要目的在于使网络中的信息不仅能让人类理解,更要让计算机也能理解网页内容,实现计算机之间的智能交互,让互联网真正成为一个全球化的信息共享和智能服务平台。这样,可以将人们从Web中“资源丰富,知识匮乏”的窘境和苦恼中解放出来,帮助人们从繁杂的Web信息中快速而有效地找到有用知识。5重庆大学硕士学位论文2语义Web和本体语义Web是人工智能和Web技术相互结合的产物,虽

6、然它是一种更加优越、更加个性化的Web,但要完全实现却是一项复杂的工程。在语义Web中,要使计算机对信息进行判断和推理,实现智能检索,首要条件就是要给网页内容添加元数据,显示其涵盖的语义信息,方便计算机理解网页内容,这个添加语义信息的过程其实就是语义标注的过程。此外,还需要用户为计算机精确地指出需要寻找的东西。当然,在智能检索的过程中还要确保不同网站下的内容能够被充分地共享,以保证检索结果的高效。比如,在浏览葡萄酒方面的网页时,语义Web将会给每一篇新闻、文章添加语义标注。在这些标注里含有丰富的语义信息,分门别类地详细描述了哪些是葡萄酒名,分属于

7、哪类酒,产自何处等信息。这样,对于普通的非葡萄酒专家的用户而言,可以很轻松地阅读和理解这种专业性很强的信息,而且假如在搜索引擎里输入“CabernetSauvignon”(赤霞珠葡萄酒)时,可以很方便地查找到CabernetSauvignon葡萄酒的信息,而不是某个人名为CabernetSauvignon或别的信息,真正做到了有的放矢,避免了从大量的搜索结果中筛选所需的网页。所以说,智能化的实现复杂检索,尽可能多地发现有用信息,新颖的网络信息阅读方式等都是语义Web为我们提供的辉煌前景。2.1语义Web的体系结构2000年12月,在华盛顿举行的X

8、ML2000会议上,Berners-Lee首次明确提出了语义Web体系结构[13],指明了语义Web的研究框架,如图2-1。这是一个自下

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。