4、据和电子病历数据。这些数据不仅有助于做出临床诊治决策,也是开展流行病学研究的基础。在药物研发领域,研究人员寻找靶标、建立模型、寻找化合物等过程中产生的数据量非常庞大,如果能将隐藏在数据中的知识通过定量的方法挖掘出来,用以指导下一阶段的研究方案的设计,可大大提高药物研发资源的利用率,提高研发效率。事实上,生物医学科研模式也正在悄然发展改变。2013年l0月发表在Sc/ence上一篇题为“Biology's Dry Fut ur e”的论文介绍基于大数据的研究模式“干试验(dry l ab biology)”
5、[61。该文以美国斯坦福大学44岁的终身教师Butte为例,他在糖尿病、肥胖症、移植排斥反应以及新药发现(主要是发现治疗肺癌的新药,以及治疗其他一些疾病的新药)等方面都颇有建树。他抛弃了传统实验室的工作模式,他们实验室既不培养细胞也不做DNA测序,他们在海量的数据库中搜集公开的信息,如人类基因组序列数据(Hum an Genome Sequences)、肿瘤基因组序列数据(Cancer Genome Readout s)、脑扫描成像数据(B rai n Im aging Scans)以及糖尿病、阿尔茨海默
6、病等多种疾病相应的生物标志物数据(Bi omarker s)等,并对这些生物医学科研数据进行深度挖掘。美国哥伦比亚大学的A sa A beliovich等人通过对一个迟发型阿尔茨海默病患者和正常人脑组织的基因表达数据的公共数据库进行大数据分析,发现一个新的分子能够部分决定携带了APOE4基因的人是否会患上阿尔茨海默病,并在实验室里用小鼠动物实验以及选择公共的阿尔茨海默病患者脑扫描成像数据库对患者数据进行分析并验证了该结果。可见,未来生物医学科研数据的利用、共享和复用甚至可以使科研人员不用再做真实的试验。1
7、.2国内外相关科研政策出台美国自然科学基金委员会(NSF)2010年1月发布的NSF项目管理指南规定,从2011年1月18日开始,所有提交到NSF的项目申请书必须包含“数据管理计划”(Dat a M anagem ent Pla n),没有数据管理计划的项目申请将不予接受。对已批准的项目,管理者会根据项目的年度进展和最终报告对其数据管理计划的实施情况进行评估。英国七大研究理事会中,除工程和物理科学研究理事会(EPSRC)8[,,其他六个理事会均颁布了相应的数据管理政策。如生物技术与生物科学研究理事会(B