欢迎来到天天文库
浏览记录
ID:55930656
大小:377.50 KB
页数:6页
时间:2020-06-16
《基于Canoco的CCA数据处理过程解析.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于Canoco的CCA数据处理过程解析一、数据处理1、数据格式要求在Excel表格里面,你必须将数据做成矩形形式。默认的方式(也是常用的方式)是一行代表一个样方,一列代表一个变量。表格左顶格最好是空着。最好第一列和第一行分别有样方编号和变量的名称。必须注意的是名称不能超过8个字符,如果超过8个字符,CANOCO会自动截取前8个字符作为名称。变量名称最好是英文字母、数字、圆点或是连字符,空格也可以。除了第一行和第一列,表格内剩下的填充内容必须是数字或是空着,绝对不能使用字符型数据。定性变量(因子)必须
2、转换为哑变量(0‐1数据)方可进入CANOCO分析。当数据在Excel表格里按要求整理好后,将包含数据的矩形方阵选定,然后选择“复制”按钮,此时数据便复制到剪贴板中。WCanoImp便可以从剪贴板中读取数据。如图1‐2a所示,WCanoImp可以从“开始”菜单中Canocoforwindows下来菜单中打开。此时会弹出WCanoImp对话框,上半部分包含如何使用该程序的简短信息,下半部分是一些可选框。如果在Excel表格数据是按照默认方式组织你的数据,第一选项不必选,相反,如果是数据结构正好相反,以列
3、代表样方,以行代表变量,必须选中这个“EachcolumnisaSample”选项。除非你的数据是样方很少而变量很多(Excel表格里面列数不能超过256列),否则不推荐用这种方式组织数据。如果你没有样方或是变量没有编号或是名称,可以选择下面两个选框,程序会帮你给各行各列附上默认名称(Sample1,)。最后一个选项是问你是否存为压缩型数据类型,除非你觉得硬盘空间不够大,否则不必选这个选项,是否选这个选项中对于分析结果毫不影响。当你确定所以的选择是正确的,你就可以按下save按钮,系统弹出新的对话框让
4、你选择保存新文件地方和取个文件名,之后会让你给这个文件加个标注,这个标注内容将显示在新文件的数据内容第一行,以便日后数据内容的识别。选定确认后,程序会告诉你保存成功。图1‐2aWCanoimp程序打开途径图1‐2b数据的参考模式及WCanoimp对话框2、物种数据的转化排序的过程在于寻找最佳预测响应变量的坐标轴,此时坐标轴代表回归预测器(解释变量)(这些内容将在《基于CANOCO的生态学数据的多元统计分析》第3章详细解释)。因此,在排序中对响应变量进行转化,就好比在多重回归中要将很多物种数据转化一个单
5、因变量的形式一样。有点限制的是,在排序中,所有的响应变量应该是做一致的转化,因为响应变量经常是同一属性的数据,具有一致的量纲。在基于单峰模型(加权平均)的排序(见3.2节),所有响应变量的数据不能是负值,这就要求某些带负值的数据必须转化,而且对于转化的结果有更严格的要求(不能为负值)。这个限定(非负值)对于对数转化更应该值得注意。因为1的对数为0,而处于0‐1之间的值取对数是负值。因此,在CANOCO里面提供了变通的对数转化公式:在对y转化之前,你可设定上面公式中A和C的值,让输出的y`值保证不小于0
6、。在系统中,A和C默认值均为1,这样可以保证本来是0的值,转化后仍为0,而其他的值依然是正的。然而,如果你的原始值很小(比如说处于0‐0.1之间),可以将A的值适当增大,比如说设为10。但对于百分比数据和普通的点数据,默认的转化(log(y+1))是比较合适的。什么情况下需要对响应变量进行对数转化是个很难回答的问题,统计学家的答案也是五花八门。我们建议你不必太在意关于数据的分布特征,比如原始数据不一定符合理想的正态分布,对于排序来说,也不一定非要通过对数转化为正态分布的类型。是否需要对数转化,关键还是
7、比较原始数据和转化数据分析处理的最终结果哪个更好解释你所要探讨的问题。正如上面所描述那样,排序可以被看作多重回归的扩展,所以整个排序方法可以用简单回归的语言来描述。你可以通过一个或多个预测器(环境因子或排序轴)来预测一个响应变量(比如物种的多度)。比如,在一元线形回归方程中(y=B0+BX+E),你可以问当x变化一个单位时,y的平均值是如何变化的?如果自变量和因变量都没有对数转化,你可以回答这个问题:当x增加一个单位时候,y的增量是B。但在很多情况下,你可能更倾向听到这样的解释,如果变量X增加一个单位
8、,Y的量将增加10%,或是,y增加1.1倍这样的话。显然,这已经并不是线形回归模型所能体现出来的,因此,这种前情况下,你需要对响应变量进行对数转化。同样,如果预测器(环境因子)变化是成倍增长,此时的环境变量也应该被对数转化。植物群落组成数据有时是半量化估计尺度数据,比如最典型的例子是多度的Braun‐Blanquet等级估计(7个等级水平,分别为r,+,1,2,3,4,5这7个标号表示)。这个等级估计经常在数据表格里用1‐7的数据来代替原来的标号进行分析
此文档下载收益归作者所有