数学建模华中赛b题优秀论文

数学建模华中赛b题优秀论文

ID:36111215

大小:585.00 KB

页数:23页

时间:2019-05-06

数学建模华中赛b题优秀论文_第1页
数学建模华中赛b题优秀论文_第2页
数学建模华中赛b题优秀论文_第3页
数学建模华中赛b题优秀论文_第4页
数学建模华中赛b题优秀论文_第5页
资源描述:

《数学建模华中赛b题优秀论文》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、--第八届华中地区大学生数学建模邀请赛承诺书我们仔细阅读了第八届华中地区大学生数学建模邀请赛的竞赛细则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严

2、肃处理。我们的参赛报名号为:参赛队员(签名):队员1:----队员2:队员3:武汉工业与应用数学学会第八届华中地区大学生数学建模邀请赛组委会第八届华中地区大学生数学建模邀请赛编号专用页选择的题号:B参赛的编号:----(以下内容参赛队伍不需要填写)竞赛评阅编号:----第八届华中地区大学生数学建模邀请赛题目:基因调控网络的重构及病毒感染的致病机制【摘要】一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因调控网络。基因调控网络的研究是从基因之间相

3、互作用的角度揭示复杂的生命现象,是当前生物信息学研究的前沿。疾病的发病因素和原理,对于医疗领域有着十分重要的作用。这不仅仅能够让更多的患者免受病痛的困扰,还能促进人类医学史的进步。所以根据基因数据谱来重构基因调控网络,以及某个疾病症状产生的原因的研究具有很大的意义。本文对基因调控网络的重构以及导致严重临床症状的蛋白质进行了研究和推测。由于所给的基因数据谱(附录一)十分庞大,所以首先要对数据进行降维处理。本题基于时间序列给出了272组基因数据,为了减小噪声以及缺失值对实验精度的干扰,在实验前对四组噪声

4、较大或有缺失的数据进行剔除。具体的降维方式采用了多元统计法中的主成分分析和聚类分析:先对这一万多个数据做主成分分析,从这一万多个数据中,通过线性变化选出了1000个左右的重要变量来组成新的样本。既降低了数据的处理难度,又尽量保持了新数据和原数据相比,尽可能保持原数据的信息。然后用spss两阶聚类法粗略地对要聚类的数目进行一个估计,根据此估计用K-means算法对数据进行处理,得到相应的30组数据。对这30组数据建立模型,来重构基因调控网络。本文中采用的模型是线性回归模型,并对它的合理性,以及相较贝叶

5、斯网络作了对比。最后依据所得到的系数矩阵进行基因网络图的绘制与呈现。----问题二在第一问的基础上,寻求导致产生严重临床症状的蛋白质。根据附录二给出的个体出现感染症状时间节点示意图,1代表此志愿者在该时间节点表现出了临床症状,0则表示没有,这是一个二分类。本题采用逻辑回归模型,利用LR分类器模型去寻找该重要蛋白质。用268组数据,其中每一个基因视为该组数据的一个属性,对这些基因进行LR分类,并得到相应的系数矩阵。然后对系数矩阵进行分析,取出影响比较大的几个基因,然后对照基因表对基因作用的描述去寻求该

6、重要蛋白。本题最终找出四个导致志愿者产生严重的临床症状的蛋白质。所有代码实现,以及每次得到的系数矩阵均在附录中给出。关键词:线性回归模型,基因调控网络重构,多元统计法,主成分分析,聚类分析,逻辑回归(LR分类器模型)1.问题重述通过基因之间的相互调控,生物体可以实现细胞的生长,器官的发育、以及免疫等各种生物机能。随着测序技术的发展,产生了越来越多的高通量实验数据。基于这些实验数据重建基因调控网络(Generegulatorynetworks,GRNs),对于深入了解生物机能的实现过程具有重要作用。生

7、物实验中,在17个健康志愿者鼻内接种流感病毒H3N2/Wisconsin,其中9个人出现了严重的感染症状,另外的8个人没有出现症状。接种后,每隔大约8h从血液中采集样本测量基因表达谱数据,实验数据一共有16个时间点(单位:h),包括baseline(-24),0,5,12,21,29,36,45,53,60,69,77,84,93,101,108,共268----个样本。基因表达谱数据见附件1,其中前8个为未出现严重感染症状的数据,后9个为出现严重感染症状的数据。(其中行代表探针号,对应着不同的基因

8、;列为各个个体血液样本在各个时间节点的数据)个体出现感染症状的时间节点示意图见附件2。问题:1)根据实验数据重构基因调控网络;2)通过比较出现感染症状的志愿者和健康志愿者的样本数据,试确定病毒感染人体后导致志愿者是否会出现严重临床症状的重要蛋白。1.问题分析一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因调控网络。更一般些,几乎所有的细胞活动都被基因网络所控制。生命是存储并加工信息的复杂系统,孤立地研究单个基因

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。