关于网络标注的主要方法概述

关于网络标注的主要方法概述

ID:23005712

大小:53.00 KB

页数:6页

时间:2018-11-02

关于网络标注的主要方法概述 _第1页
关于网络标注的主要方法概述 _第2页
关于网络标注的主要方法概述 _第3页
关于网络标注的主要方法概述 _第4页
关于网络标注的主要方法概述 _第5页
资源描述:

《关于网络标注的主要方法概述 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、关于网络标注的主要方法概述:张瑜 孟宪学 苏晓路 李景   [论文关键词]大众标注 语义标注 本体  [论文摘要]认为标注对于检索至关重要,网络标注在网络资源海量的今天更是如此。介绍网络中标注的方法:元数据标注、聚类标注和分类标注,并对大众标注和语义标注进行详细介绍。最后对这些标法方法进行比较分析及评价。    在网络信息爆炸的今天,让用户检索到需要的信息至关重要,因而网络环境中标注显得尤为重要。目前对于标注的定义大家没有统一的说法,但是本质上都是一致的。概括来说即通过对文献进行主题分析,识别其重要特征,赋予确切的检索标识(类

2、号、标题词、叙词、关键词、人名、地名等),用以反映该文献内容的过程。标注的质量,对文献的检索效果有直接的决定性影响。标注的类型从不同的角度划分有无数据标注,聚类标注,传统网络的分类,L、万维网,都柏林核心集表现出束。  1.1.2 聚类分析聚类分析是将事物按其某些属性的相似程度归至各个群体。传统的文献聚类方法主要有单遍聚类法、逆中心聚类法,密度测试法、图论法等。这些方法大都通过计算文献的相似度,生成待进行聚类分析的文献集的关系矩阵,然后通过分析此矩阵获得文献集的分类。ationbySubject,英国BUBLSub,jectT

3、ree利用《国际十进分类法》编制了覆盖国内综合性网上资源的目录等;另一种是采用网络自编分类法的形式。网络自编分类法是20世纪90年代新兴的专门网络资源分类工具,以Yahoo、搜狐、美国的Excite等为代表的分类系统重视以事物对象为中心设置类目,以超文本的方式反映相关类目,现已发展成为许多门户网站普遍使用的一种模式。  随着Inter的出现,海量的网络资源使得利用受控语言进行标注的可操作性变得越来越差,而利用自然语言进行全文检索以其方便、成本低、效率高等优点获得了全面发展,并很快成为因特网资源检索的主流技术。在专业人员创建元数

4、据、创建元数据表现出种种问题情况下又出现了第三种方法;用户创建的元数据,其应用体现在asVandery(Floksonomy,由“Folks”和“Taxonomy”合成),即集合众人之力产生的社会分类法。Folksonomy可被译为“分众分类”、“大众分类”、“自由分类、“社会分类”、“通俗分类”,我们认为“大众标注”更能反映出“folksonomy”是一种大众性的、自由式的标注。大众标注是一种使用用户自由选择的关键词对网站进行协作分类的方式,而这些关键词一般称为标签(tag)。该方法是大众自发的用标签对网络信息标识和共享的过

5、程,它没有权威、成形的分类文本,而是依据大众日常口头词汇对信息标记,其结果表现为系统的标签云,标签云易于直观地组织信息和共享信息,同时亦因缺乏等级结构、不精确、滥用、同义词等为研究者所质疑。但网民却接受了此种“有胜于无”的方案。  大众标注法分为宽(Broad)大众标注法、窄(NarroBemes-Lee提出的语义arques等认为语义网的成功在于能够在e等基于操作参数之间的联系,在工作流中反复试验,推断关于操作参数的相关语义信息。虽在开放的上下文环境中只能推断参数语义的约束,但这些松散的标注在工作流、标注、本体中检测错误仍然

6、有价值,在简化手工标注的任务中也很有价值。    2 比较分析    专业人员创建元数据最主要的问题是内容扩展时的可扩性和可行性问题,尤其是在万维网中。并且专业的编目系绩工具对于没有专门培训和知识的人来说太复杂;创建元数据也有问题,经常出现不恰当、不准确的标注,或者完全是虚假标注。  采用聚类分析方法对用关键词或自由词标引的检索系统中的词表建立词间关系,可以形成语义网提高系统检索效率,达到语义控制的目的。但汉语词条高达数百万条使得待聚类的anticIndexing—LSI)的Web文档自动分类,即对Web文档采用最优聚类准则进

7、行聚类,使得获得的特征向量具有较低的维数和更好的分类特征。  亚当·马斯认为大众标注将取代以往由专家控制的元数据编辑管理。MariekeGuy认为大众标注指的就是关键词、标签、元数据,是由使用资源的社区创建的自然语言,术语间不存在层次结构,没有特定的父子与兄弟关系,有反馈现象,是种类而非分类。  而在语义标注中人们将本体引入标注系统用于知识的组织。之所以将ontology引入网络信息资源组织领域,是因为ontology的研究着眼于更加宽泛的空间——即为人类认识活动构建顶层概念框架;ontology更加突出知识共享的功能,更着眼

8、于给出人类事物认识的知识(或领域知识)总框架,以期待将Inter上的信息资源组织成一个语义网、知识网,以最大程度实现Inter信息资源的有效利用。    3 评价    正如Davidwelnberger所述,大众标注法不同于传统分类法,最重要的地方表现在传统分类法是自顶向下

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。