资源描述:
《随机微分方程在数理金融中的应用硕士学位论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工业大学理学硕士学位论文摘要复杂数据主要表现在相依、非线性、维数高与不完全观测等,在股市、基因序列和经济等领域中经常出现。为解决巨型数据集合问题,数据挖掘的理论、方法和技术已应运而生。而针对诸如怎样同时检验成千上万个基因中哪些基因的表达水平有显著性差异之类的高维统计推断问题,以错误发现率为主要特征的非参数估计方法无疑为其提供了一个有效的解决途径。本文主要研究考察错误发现率的在各种参数模型和非参数模型下的控制检验方法,全文共分为四章。文章首先介绍了所选取课题的背景和意义,以及国内外在该方向的研究现状。在多重
2、假设检验的背景下,给出了错误发现率的定义,提出利用p值进行假设检验,并在假设检验独立和相依的情形下对错误发现率的控制方法进行了探讨。在研究错误发现率的控制方法时,发现在处理多重假设检验问题时,核心的问题是如何估计真实零假设的个数,因此本文采用经验贝叶斯估计来估计它的值。在参数混合模型和非参数混合模型中研究真实零假设的估计问题是本文的核心内容。针对正态混合分布模型和Beta混合分布模型两种参数混合模型,文章采用矩估计方法和基于p值的最小二乘估计方法进行研究;在研究非参数混合模型时,分别介绍了最小二乘估计方法、Be
3、ta分布拟合模型和Beinstein多项式拟合模型的方法。文章的最后以Hedenfalk报告的一组乳腺癌患者的基因数据为例进行仿真研究,发现错误发现率为微阵列数据的多重假设检验提供了合适的错误控制指标。关键词:错误发现率;多重假设检验;p值;非参数估计;微阵列数据-IV-哈尔滨工业大学理学硕士学位论文AbstractComplexdataalwaysappearinthestockmarket,genesequences,economicandotherfields,whichmainlyshowthechar
4、acteristicofdependent,nonlinear,highdimensionandincompleteobservations.Inordertosolvetheproblemofhugedatacollection,thetheories,methodsandtechniquesofdataminingareproposed.Whilehowtoexaminethehigh-dimensionalstatisticalinferenceproblem,suchasthesignificantdi
5、fferencesofexpressionlevelsinthousandsofgenes,thenon-parametricestimationoffalsediscoveryrateprovideaneffectivesolution.Thispapermainlyinvestigatethetestmethodbasedonthefalsediscoveryrateofvariousparametricmodelandnon-parametricmodel,whichisdividedintofourch
6、apters.Firstly,thispaperintroducethebackgroundandsignificanceofthetopic,andthecurrentstudiesinthisdirectionathomeandabroad.Underthebackgroundofmultiplehypothesestesting,thepaperdescribethedefinitionofthefalsediscoveryrate,proposeusingthep-valuetotestthehypot
7、hesistesting,anddiscussthecontrollingmethodofthefalsediscoveryratewhenthehypothesestestingisindependentordependent.Whenweinvestigatethecontrollingmethodofthefalsediscoveryrateandstudiedthemultiplehypothesistestingproblem,wefindthatthecentralproblemishowtoest
8、imatethenumberoftruenullhypothesis,sothispaperusetheempiricalBayesestimationtoestimateitsvalue.Investigatingtheestimationoftruenullhypothesisinthemixingparametricmodelandnon-parametricmodeliscor