国外folksonomy语义丰富研究综述

国外folksonomy语义丰富研究综述

ID:34534073

大小:505.66 KB

页数:6页

时间:2019-03-07

国外folksonomy语义丰富研究综述_第1页
国外folksonomy语义丰富研究综述_第2页
国外folksonomy语义丰富研究综述_第3页
国外folksonomy语义丰富研究综述_第4页
国外folksonomy语义丰富研究综述_第5页
资源描述:

《国外folksonomy语义丰富研究综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、情报资料工作2010年第3期鬻遵黉技术有限公司协办国外Folksonomy语义丰富研究综述六魏来(东北师范大学计算机科学与信息技术学院长春130117)(中国科学院国家科学图书馆北京100080)摘要文章对国外folksonomy语义丰富的理论与实证研究进行了全面的梳理,从folksonomy的聚类、推荐、关联和实证四个方面探讨folksonomy语义丰富的方法和途径,优化网络信息资源组织。关键词folksonomy语义丰富语义folksonomyReviewoftheResearchofSemanticEnric

2、hmentofFolksonomyAbroadWeilai(AcademyofComputerSciencesandInformationtechnologyNortheastNormalUniversity,Changchun,130117)(NationalScienceLibrary,ChineseAcademyofScience,Beijing,100080)AbstractThepapercomprehensiveresearchesthetheoryandpracticeoffolksonomysema

3、nticenrichment,in-cludingfolksonomyclustering,suggesting,relatingandpracticing.Keywordsfolksonomy,semanticenrichment,semanticfolksonomyFolksonomy由ThomasVanderWal于2004年舀‘次提出⋯,是Web2.0社会性软件]具应用的典代表。1Folksonomy的标签聚类研究目前,已经在各种社会性网站L,泛应用,如社会性相同或相似标签能够通过一定的聚类方法聚集书签服务

4、de1.icio.US,flickr,社会性编H网站标注存一起,形成基于用,rLI兴趣的标签集合。根据标签聚服务librarything,BibSonomy等。Folksonomy作为一类目的,标签聚类方法可分为相同标签聚类和相似种自底向上的公众分类方法,能够作为集体智慧的体标签聚类两种。现,提供流行的、反映用户必趣的标签,具有简单、卞1.1相同标签的聚类方法富、流行和多样的特点。但随着标签数最的增加,folk—相标签聚类方法的目的是将意义相同或描述主sonomy的进一步应用出现了一些制约因素,如标签的题相同的标签

5、聚类(女Il“folksonomy”和“folksonomies”),歧义,平面延展的标签结构,标签之问的语义关系等,主要有三种方法。这些问题会制约标签进一步使用。解『火这些问题的主(1)词根还原方法(Stemmingalgorithms)。词根还原要方法是为folksonomy提供一定的语义关系,即folk—方法是从词中抽取词根聚类相同词根标签的方法。sonomy语义丰富。WellerK于2007年指出folkSOnomy如“links”和“linked”经过词根还原算法都聚类在“link”能够从现有的知识组织系

6、统中获得标签控制和语义标签下。HendS等人存文献【7]中使用了词根还原算法关系的构建原则,同时提供有用的语义卜寓知识组标准化处理标签,将{:}f同词根的标签聚集在一起。织系统,改进现有的分类法、叙词表或本体。。国外研(2)字符串距离测度方法(Stringdistancemetrics)。究人员对该领域的研究较为活跃,本文从folksonomy字符串距离测度方法是测度标签字符串之间区别的方语义丰富的几个核心问题——聚类、推荐、关联及实法。最常用的是Levenshtein算法,即计算两个字符串之证出发,探寻国外fol

7、ksonomy语义十富的主要方法和间的编辑距离,这个“距离”是从源字符串变换到目标字途径符串需要进行的删除、插入和替换的最少次数。L.★本文系“中央高校基本科研业务费专项资金资助”项目(编号:09QNJJ029)的研究成果之一。情报资料工作2010年第3期信Specia和E.Motto在文献[8】中使用了Levenshtein算(2)文档向量空间聚类方法(VectorSpaceMode1)。息法,从形态学上聚合词形与语义相同的标签。文档向量空间聚类方法是计算文本之间距离或相关技(3)在线资源探测方法(Exploit

8、ingonlineresources)。度的方法。HeymannP在文献n4]中,使用向量空间聚术使用在线资源如WordNet,google等进行标签控制,如类方法。从de1.icio.US网站搜集60000个标签,根据标标签的拼写,单复数和词形规范等,同时找出相同标签的向量相似度确定相关标签,将相关标签连接成无签集合中有代表性的标签。L.Specia和E.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。