资源描述:
《中医药学数据库发展策略 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中医药学数据库发展策略刘岩,尹爱宁,周雪忠,宓京华【关键词】中医药学;数据库;结构化;数据整合中医药学数据库的建立起源于20世纪80年代[1],至今已经建立一大批中医药数据库并服务于专业人员,在推进行业发展与科研创新中产生了重要作用。进入21世纪后,中医药学数据库的数据量呈现了迅猛增加的态势,数据库的建设形式与服务方式也都呈现出多元化的特点。以中国中医科学院为例,从2000年到现在,已经从8个数据库发展为118个,数据从4G发展为236G;数据库也从文献型为主,发展为结构型与数据仓库类型。 面对迅猛增
2、加的中医药数据,如何对原始数据进行存储、管理、 3建立中医百科知识网络图谱2008年,生物医学信息学首次提出生物信息维基组学的概念,其目的在于解决当前海量数据的知识发现。生物信息与基因、蛋白质组学研究具有一样的群体研究的需求特征,需要在一个平台上,构建群体知识网络,设计数据采集的标准模式,形成一个百科知识图谱,加速生物学的进展。笔者认为,中医百科知识网络图谱建立应该立足以下两个方面。 3.1知识资源描述 根据中医药数据集的元数据定义,对信息对象的内容和位置进行描述,从而为信息对象的存储与利用奠定基
3、础。先从庞杂的网络信息资源数据中获取有用信息,再理解其中的逻辑关系或模式形成知识,这是一个增值的过程。其过程中所采取的方式,除了与网络信息资源的形式特征有关外,最根本的依据还是描述网络信息资源的元数据。通过规范元数据可以合理地描述与揭示网络信息资源的内涵,由网络机器人对元数据进行标引和分类,再适当进行知识组织,将其添加到相关智能搜索引擎数据库中,通过具有一定智能性的检索工具,就可以十分容易地获取有关知识。 3.2基于语义进行搜索中医药语言系统提供语义搜索的基础,将信息对象中的重要信息取出,加以抽象描述
4、,并建立其语义关系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。 目前,中医药智能搜索就是采用这种原理而研制的,在用户与信息资源之间创建了一个知识库,这个知识库实质上就是语义的集合。其中的知识语义网络可粗略分为3个层面:一是语言层,反映语言表面现象的知识,如一个词的多种形式,它的同义词、反义词,一些习惯用语、词的层次关系等;二是本体论层,对概念的本体论定义与解释,概念之间复杂的语义关系;三是常识层,发现常识上的关联,例如疾病相关的病因、病机、诊断、治疗等。基于信息资源知识描
5、述与中医药语义搜索的双核驱动的方法,从数据外部与内在关联进行有机整合,为知识发现提供了重要途径。 4面向专题的多类型数据整合服务对用户来说,理想的状态是:通过一个界面即可迅速查到所需信息并加以取用,系统扩展整合功能可帮助用户实现其理想。系统扩展整合功能是指数据库开发商借助互联网,利用超文本技术,在不同的信息资源之间进行链接,将原本相互独立、但互为联系的信息资源与服务整合在一块,使之形成一个互动的有机整体。中医药数据库的大小和其功能的强弱决定了数据库的利用价值,中医药信息数据库系统也将同其他的数据库系统
6、一样朝着大型数据库系统发展。由于不同的历史时期建立的不同的数据库累积,形成了数据库之间的沟壑,每个数据库不同的服务方式,给科研人员带来了应用障碍。解决当前的问题,除数据库整合外,增加数据库的功能,可以弥补传统数据库系统诸多不足,满足诸多学科发展的需要。中医药数据库需要扩充的主要功能为:①增加不同层次、级别的关系揭示与指引,揭示不同加工层次和文献级别的数字资源之间的关系,并基于这种关系,建立从二次文献、结构型数据库到一次文献的全文指引和链接。②扩充学科逻辑主线导航和指引,按学科或主题相关的聚合,建立适用于
7、揭示资源的整体逻辑关系的智能导航,解决由于异构带来的关系阻隔。③研制对象互操作性挖掘内在、动态的复杂联系,预先发现并找出一种途径和线索来描述这些关系,将数字资源深层的内在联系挖掘与实现。④建立引证关系(引用、被引,同被引),揭示学科和主题的内在、广泛和深层的关联,特别是对于交叉学科、边缘学科、新兴学科,可以从多维角度反映学科间的相互渗透和相互交叉的关系,促进基于知识管理的研究团队的开放式链接和整合。【