plink命令汇总情况情况

plink命令汇总情况情况

ID:29041264

大小:28.31 KB

页数:4页

时间:2018-12-16

上传者:linlin921
plink命令汇总情况情况_第1页
plink命令汇总情况情况_第2页
plink命令汇总情况情况_第3页
plink命令汇总情况情况_第4页
资源描述:

《plink命令汇总情况情况》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

实用标准文案关联分析步骤个人总结,还一些问题待解决已有1570次阅读 2013-2-620:34 |个人分类:科学笔记|系统分类:科研笔记|关键词:安装软件个人总结style 希望查看此贴的同仁们对步骤提出改进,指出不足,谢谢!  一、软件安装和存放 1.       将plink文件直接放在D盘 ;将map和ped文件拷贝到plink文件下面,保证和在一起;2.       Ped文件的格式和map文件都是先弄成txt文件,再直接更改文件后缀。可以在excel里先将需要的格式把数据排列好,再将excel保存为txt,再改txt后缀为ped或map.1) (.PED) 文件的前六列是强制的格式,依次为:ped文件包含内容的顺序依次为以下信息备注FamilyID可以用1,2,3,4……表示IndividualID用入库编号表示PaternalID可以用0表示MaternalID可以用0表示Sex1=male;2=female;other=unknownPhenotypecontrol设定为1,case设定为2Genotype如AT,中间空一格,缺失用0补平2) (.MAP) 文件包括以下的四项:map文件包含内容的顺序依次为以下信息备注chromosome1-22,X,Yor0ifunplacedrs#orsnpidentifierrs号Geneticdistance(morgans) 可以用0代替Base-pairposition(bpunits)用NCBI上的染色体起始位置3)协变量信息: 协变量先单独建立一个文件,要txt格式的,比如有10个协变量,我命名为var01.txt。这个文件必须放在和ped,map和plink.exe文件一起。Var文件是先在excel格式里面整理好,删除第一行协变量的表头,但自己要单独记下来每列代表的意思,然后转化成txt文本格式,就是另存为txt。顺序依次为:familyID,个体ID,后面就是协变量了(number1-10),空缺的信息的用-9补全。 二、软件启动开始——运行——cmd精彩文档 实用标准文案C:DocumentsandsettingsAdministrator>cdC:DocumentsandsettingsAdministratorC:DocumentsandsettingsAdministrator>d:D:>cdplink 三、软件运行的命令 前提是冠心病数据文件分别为1.ped和1.map;用file1 和bfile3的结果相似,那些限制性条件只是去掉了3个对照;单倍型分析,在同一染色体上且位置较近的SNP分析单倍型才有效,不同染色体上SNP的分析那是联合效应分析运行命令功能plink--file1--make-bed--out2转成二进制文件,2即为二进制文件了plink--bfile2--maf0.01--geno0.05--mind0.05--hwe0.001--make-bed--out3设定过滤数据plink--bfile3--filter-controls–hardy计算control的hw,将hwe<0.05的位点过滤掉,23个SNP又去掉了2个SNPplink--bfile3--assoc--adjust--outassoc1等位基因的关联分析,每运行后及时更改文件名称(assoc1+时间)plink--bfile3--filter-females–assoc--adjust--out333女性样本关联分析plink--bfile3--filter-males–assoc--adjust--out444男性样本关联分析plink–bfile3–assoc–perm  permutation检验,就是模特卡罗模拟分析经验性的P值plink–bfile3–all--missing缺失率或得出率(callrate)分析,查看log文件结果plink–bfile3–model–outmodel1默认是卡方检验plink–bfile3–model–fisherfisher检验,但是结果比卡方检验差plink–bfile3–logistic--ci0.95--covarvar01.txt分析所有的协变量精彩文档 实用标准文案plink–bfile3–logistic–covarvar01.txt–covar-number1,3,5只分析1,3,5这几个协变量plink–bfile3–logistic–sex plink–file1–logistic–ci0.95加性模式下分析plink–file1–logistic–ci0.95–dominant显性模式下分析plink–file1–logistic–ci0.95–recessive隐性模式下分析plink–file1–logistic–ci0.95–genotypic         基因型分析plink--file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6加性模式下分析plink--file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–dominant显性模式下分析plink–file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–recessive隐性模式下分析plink–file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–genotypic基因型下分析plink–bfile3–hap-snpsrs653667,rs2261434–hap-assoc单倍型分析Plink–bfile3–filter-cases只包含casesPlink–bfile3–filter-controls只包含controlsPlink–bfile3–filter-males只包含malesPlink–bfile3–filter-females只包含femalesplink–bfile3--filter-females–logistic–ci0.95默认加性模型plink–bfile3--filter-females–logistic–ci0.95–dominant plink–bfile3--filter-females–logistic–ci0.95–recessive plink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9--logistic–ci0.95默认加性模型 plink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9––logistic–ci0.95–dominant plink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9––logistic–ci0.95–recessive  四、结果查看可以先用notepad打开看一下,也可以用excel打开,打开步骤:用excel的文件,打开——分隔符号——下一步——空格——完成,再另存为即可。看到unjust对应的P值是未校正的,plink默认Bonf校正,非常严格,校正后基本没有显著的了。如果文章中不用plink校正后的结果的话,前面的分析也不要用plink的结果,不然别人会问你为什么不用plink校正。Log文件是保存运行过的命令,如果不及时更名,就被后面的log文件给覆盖掉了。 五、关于单倍型的分析过程 精彩文档 实用标准文案分型数据结果出来后,首先要做的是按照染色体将SNP位点分类(在位点位于不同染色体的情况下),1)如上图所示,按照不同染色体分好位点数; 2)首先分析的是control数据里的LD,如果存在LD,即D’接近1,r2大小似乎关系不大,就可以判定有LD,这个在Haploview软件里面分析。分析时的数据格式整理成Linkageformat。可以把一个数据弄成ped,一个是map的。(奇怪的是我用plinkformat,系统总说我少SNPcolumn,给ped加head,genotype那里换成rs号或SNP1,SNP2之类的都不行,map文件是标准的plink格式,headless),有时间再找出问题在哪。 Map的文件:只有2列,一列是rs号,一列是染色体上的起始位置,至于这个位置,我用的是Hapmap数据库上的。不同数据库之间的相差不大,起始需要的是每2个SNP之间的相对距离,估计软件自己会计算。 Ped文件:前6列是固定的,一次为FID,IID,fatherID,motherID,sex(1male;2female),phenotype(1control;2case),后面就是基因型的了。按照SNP号排列好,但是不要表头。注意在map文件中,SNP的顺序要和这个对上。 3)结果可以看到LD,右键点击,可以看到D’,r2;点Haplotype,不知道怎么有的没有结果出来,可能是没有单倍型???对于有单倍型的,比如,对照中有这样的结果,我再计算case中的单倍型结果。得出这些数据后,我是再把数据导入到SPSS,运用卡方分析casecontrol中数据是否有差异。可惜今天分析的结果都没有差异,奇怪为什么直接用plink的haps命令结果有一个是单倍型显著的呢?(P=0.045)。精彩文档

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭