欢迎来到天天文库
浏览记录
ID:53027396
大小:474.52 KB
页数:7页
时间:2020-04-14
《国外临床数据挖掘研究热点的文献计量学分析-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、医学信息学杂志2015年第36卷第JOURNALOFMEDICALINFORMATICS2015.Vo1.36。No.5国外临床数据挖掘研究热点的文献计量学分析钟秀梅崔雷(中国医科大学医学信息学系沈阳110013)[摘要]为了解近年国外临床数据挖掘领域的研究热点,以WebofScience收录的文献为研究对象,采用文献计量学方法对“最新高被引文献一施引文献”引文网络进行聚类和分析,总结出国外临床数据挖掘的研究热点,以期对我国相关领域研究有所借鉴。[关键词]临床数据挖掘;研究热点;文献计量学[中图分类号]R一058[文献标识码]A[DOI]10.3969/j
2、.issn.1673—6036.2015.05.012BibliometricsAnalysisOiltheHotSpotsofForeignClinicalDataMiningResearchZHONGXiu—mei,CUILei,DepartmentofMedicalInformatics,ChinaMedicalUn~rsity,Shenyang110013,China[Abstract]Inordertofindoutthehotspotsofforeignclinicaldataminingresearchinrecentyears,thepap
3、ercarriesoutbibliometricanalysisontheliteraturesincludedinWebofScience.“thelatesthighcitedliteratures—citingliterature”citationnetworkisclusteredandanalyzed,theresearchhotspotsofforeignclinicaldataminingaresummarized,SOastoprovidereferencesforrelatedresearchinChina.[Keywords]Clini
4、caldatamining;Researchhotspots;Bibliometrics新的开展,因此越来越多的学者对临床数据的挖掘1引言研究产生了浓厚的兴趣。临床数据挖掘是将数据挖掘的理念和方法运用于临床数据,包括对临床数据数据挖掘是在大型数据存储库中智能地发现有的概念化、信息提取、数据分析及结果解读等,以用信息的技术,经过近些年的快速发展,如今已在期获取和补充医药学领域知识,支持知识库构建、商务领域和互联网领域得到了很好的应用,逐步扩临床决策和临床实践j。为了解近年国外临床数据展向更多领域。紧跟大数据时代的步伐,医疗领域挖掘领域的研究热点,本文对国外研
5、究学者在该领数据的数量和质量不断攀升(尤其是电子病历数域发表的文献进行分析,以认识和把握该领域的科据),这些数据蕴涵着丰富的信息,发掘潜藏于海研状况。量数据之中的知识和规律,将会极大地推动医学创2资料与方法[修回日期]2014—12—312.1样本数据获取【作者简介]钟秀梅,在读硕士研究生,发表论文2篇;通讯作者:崔雷,教授,博士生导师。在WebofScience数据库中进行检索,“临床数·57·2015年第36卷第5J0URNALOFMEDICALlNFORMATICs2015.Vo1.36.No.5据挖掘”相关检索词,见表1。检索策略:主题字删除矩阵a
6、中2008年以前的高被引文献数据,随后段=“临床数据”相关检索词AND“数据挖掘”删除原矩阵中施引总次数为0的施引文献数据,获得相关检索词,限定文献类型为“Article”,限定时间49×315“最新高被引文献一施引文献”矩阵b。为2000—2014年,检索数据库SCI—Expanded、2.3引文网络聚类CCR—Expanded、IC。数据截止至2014年7月15日。共检索到3405条记录,下载其全记录与参考运用gCLUTO1.0,对矩阵b进行聚类分析。引文格式数据作为样本集A。步骤:(1)导人数据并聚类:重复二分法、余弦相似函数、I标准函数。(2)调整
7、聚类类群数,选择表1“临床数据挖掘”相关检索词类内相似度(Isim)较高而类间相似度(Esim)较低的聚类结果。(3)文献内容较基础或较综合时,往往会引用多方面内容,在聚类结果中的表现是:以高描述度文献和高区分度文献出现在多个类群中,进而降低类内相似性,提高类间相似性,即削弱各类的特异性。为此本研究提出,若同一施引文献在一半以上类群的高描述度文献或高区分度文献中出现,则视为基础性或综合性施引文献;以此为矩阵精简条件,将这类文献从矩阵b中删除。(4)对矩阵c循环执行步骤(1)一(3),至无基础性或综合性施引文献为止。(5)最终为49×312矩阵C聚类。其中,
8、高描述度文献是指使各个类群类内相似性较高的特征性施引文献;高区分度
此文档下载收益归作者所有