【8A版】Citespace软件操作问答

【8A版】Citespace软件操作问答

ID:39840050

大小:66.00 KB

页数:7页

时间:2019-07-12

【8A版】Citespace软件操作问答_第1页
【8A版】Citespace软件操作问答_第2页
【8A版】Citespace软件操作问答_第3页
【8A版】Citespace软件操作问答_第4页
【8A版】Citespace软件操作问答_第5页
资源描述:

《【8A版】Citespace软件操作问答》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、【MeiWei81-优质实用版文档】Citespace软件操作问答(摘自陈超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.TopN2.TopN%3.ThresholdInterpolation4.SelectCiters第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。下面简要介绍一下各个方法的细节。TopN:系统设定N=30,意为在每个timeslice中提取N个被引次数最高的文献。N越大生成的网络将相

2、对更全面一些。TopN%:将每个timeslice中的被引文献按被引次数排序后,保留最高的N%作为节点。ThresholdInterpolation:设定三个timeslices的值,其余timeslices的值由线性插值赋值。三组需要设置的slices为第一个,中间一个,和最后一个slice。每组中的三个值分别为c,cc,和ccv。c为最低被引次数。只有满足这个条件的文献才能参加下面的运算。cc为本slice内的共被引次数。ccv为规范化以后的共被引次数(0~100)。SelectCiters:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之

3、一。先CheckTCDistribution然后填写UseTCFilter后面的两个数字:最低和最高TC值(TimeCited),选定UserTCFilter前的选项。按Continue,再设定方法1,2,或3。节点总数在ProgressReports中给出。节点总数越大需要内存越多。下回将介绍如何选择网络的连接密度。CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。这里介绍一些要点以供参考。CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。设置CiteSpace的各项参数大致相当于取景,调焦,对光圈。不过这些

4、过程在如今的相机中基本都已完全透明。所以,参数设置对CiteSpace所产生的图谱有直接影响。最初使用时,最简单的办法是先采用系统的预定参数;熟悉之后,再按下面提供的要点调整参数。那么什么样的CiteSpace图谱才算好图谱呢?CiteSpace的设计实际上是有针对性的。能满足CiteSpace设计要求的图谱才视为好图谱。CiteSpace要展现的是一个领域的知识发展的历史和现状。这是CiteSpace的取景范围。由于深受库恩《科学革命的结构》的影响,对CiteSpace来说,焦点自然是在范式(paradigm)和范式转移(paradigmshift)。近年

5、来大家倾向于这种认识:范式是一种更为广泛的现象,可以在各个层次上出现。换句话说,并非50年一遇或100年一遇。所以CiteSpace竭尽全力所要甄别,显示,突出的就是在广义的范式转移中起关键作用的转折点。与广义范式相对应的是科学文献中自然呈现的聚类。转折点便是联结不同聚类的桥梁。如果CiteSpace生成的图谱能清晰的显示出这些要素,这种图谱便属上乘之作。关于解读CiteSpace图谱的要点,来日再写。有了这个目标以后,图谱如能显示俩三个或更多的自然网络聚类,而且各聚类之间有少量的联系,便为最佳。这样的图谱很容易带来有趣的和有意义的发现。【MeiWei81-

6、优质实用版文档】【MeiWei81-优质实用版文档】相反,如果图谱中所有节点都纠缠在一起,则很难理出头绪。如果碰到这种情况,检查下面几种原因:数据范围是否过窄,门槛设置是否过高(threshold),曝光时间是否过短(timeslice)。另外,可用CiteSpace中的链接剔除功能(pruning)来剔除一些次要的链接以突出核心结构。成像以后,CiteSpace可提供进一步的指标。比如,modularity大约在0.4~0.8时的图谱通常会符合或接近上述要求。另外,如果可能从每年或每个时间段中选取数量大致相当的数据,会比每年都使用同样的门槛要更有效(相对于

7、上述目标而言)。做专利分析的时候,发现转换德温特专利的数据;还有就是,C、CC和CCV阈值的选择有没有什么标准呢?TopN和TopN%更直接,建议你用这两项。c,cc,ccv的选择灵活但较为复杂,参考20XX年我的PNAS文章。从前,c有选5次以上的,ccv有选25%以上等等在文献中都可见到。阈值低的覆盖面会稍微广一些。考虑到文献数据本身的误差,以及大部分人的注意力往往集中在最有代表性的工作,所以阈值的选择总是相对的。WOS并不包括所有的文献。另外,信息和噪音比也是一个考虑因素。关于阙值的选择,我是不是可以这样理解,就是说,知识图谱是需要不断探索和试验的,对

8、所选择领域文献的分析必须是基于文献实际情况的,而不只

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。