资源描述:
《基于知识元的文本知识标引》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、JOURNALOFTHECHINASOCIETYFORSCIENTIFIC情报学报ISSN1000-0135ANDTECHNICALINFORMATIONISSN1000-0135第25卷第3期282-288,2006年6月Vol.25No.3,282-288June20061)基于知识元的文本知识标引温有奎(西安电子科技大学经济管理学院,西安710071)温 浩(西安电子科技大学通信工程学院,西安710071)徐端颐 潘龙法(清华大学精密仪器与机械学系,北京100084)摘要 本文提出了知识元标引的新概念,认为知识元标引是实现跨领域知识集成与知
2、识发现的基础。对文本知识元类型,标引规则,人工知识元抽取,软件知识元抽取,人工知识元修改,知识元面向对象表示,知识元对象链接等进行了分析和试验。开发出了“数值知识元”模型,取得了理论与方法的验证,证明了该方法的先进性和实用性。关键词 知识元 知识标引 软件抽取TextKnowledgeIndexingBasedonKnowledgeElementWenYoukui(SchoolofEconomyandManagement,XidianUniverisity,Xi’an710071)WenHao(SchoolofCommuicationEngine
3、ering,XidianUniverisity,Xi’an710071)XuDuanyiandPanLongfa(DepartmentofPrecisionInstrumentsandMechanology,TsinghuaUniversity,Beijing100084)AbstractThispaperpresentsanewideaofknowledgeelementindexing,whichisconsideredafoundationofknowledgeintegrationandknowledgediscoveryacrossdom
4、ain.Thetypeofknowledgeelement,indexingrule,knowledgeelementextractionwithmanualworkandsoftware,modificationofknowledgeelement,representationofobjectofknowledgeelement,linkofknowledgeelementaretestedinthispaper.Themodelofnumericalvaluetypeofknowledgeelementtestsandverifiestheth
5、eoryandmethod.Resultsindicateknowledgeindexingbasedonknowledgeelementisamethodofaccessibility.Keywordsknowledgeelement,knowledgeindexing,softwareextraction.揭示信息内容的方法,对于大多数信息活动已能满1 引 言足其需要。但是,在有些信息活动中,不仅要涉及到文献中所含信息,而且还涉及到文献中的知识和事目前,图书情报界揭示科技文献内容所采用的实。此时,仅对文献进行信息标引就不够,还需标引方法主要是“
6、信息标引”,即标引的是科技文献中所文献中的知识和事实,即进行知识标引,以满足不同[1]含的信息。其方法主要有主题法、文摘法等。这种信息活动的需要。文献[2]认为,目前国内外很少收稿日期:2005年8月8日作者简介:温有奎,西安电子科技大学经济管理学院教授,研究方向:知识管理。Email:wykui123@126.com。温浩,男,1979年生,西安电子科技大学通信工程学院博士研究生,研究方向:模式识别与智能系统。徐端颐,教授,博士生导师。潘龙法,教授,博士生导师。1) 国家自然科学基金资助项目(70373046)。—282—©1994-2006Ch
7、inaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net基于知识元的文本知识标引有关于进行知识标引的报导,并指出,从文本中进行Small)提出用思想“网络图”揭示重大发现,用学术[7]知识挖掘,是比从结构化的数据记录中进行知识发思想“网络图”来表述重大发现的来龙去脉。传统现和数据挖掘更困难(尽管更有意义)的工作。但情报学的发展已经到了一个新的转折点,需要突破是,作为今后智能文本处理发展的一个方向,我们应传统的专业角色和视野来总结和发展情报学,为
8、此该重视这方面的研究。文献[3]对科学信息离散分有人提出了建立“知识体系科学”的建议。布规律做了研究,首次发现文献单元的离