欢迎来到天天文库
浏览记录
ID:47691438
大小:58.50 KB
页数:9页
时间:2019-10-23
《生物医学大数据:现状与展望》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、生物医学大数据:现状与展望大数据(bigdata)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和分析的数据集。大数据具有“4V”特征:①数据容量(Volume)大,常常在PB(1PB-250B)级以上;②数据种类(Variety)多,常常具有不同的数据类型(结构化、半结构化和非结构化)和数据来源;③产生和更新速度(Velocity)快(如实时数据流),时效性要求高;④科学价值(Value)大,尽管利用密度低,却常常蕴藏着新知识或具有重要预测价值。人类已进人大数据时代。国际数据公司的研究结果表明,2011年全球产生的数据量高
2、达1.82ZBo2012年5月,联合国发布了《大数据与人类发展:挑战与机遇》白皮书,指出大数据是一个历史性机遇,人们可以使用极为丰富的数据资源对社会经济进行前所未有的实时分析,帮助政府更好地响应社会和经济运行。大数据受到越来越多的重视。欧美国家许多高校纷纷成立了数据科学研究机构,开设了数据科学课程。Nature和Science也分别于2008年和2011年推出了大数据专刊,对大数据带来的挑战进行讨论。作为最活跃的科学研究领域之一,生物医学领域的大数据也备受关注。1.生物医学大数据的来源:以下因素促进了生物医学领域大数据的出现。①生命的整体性和疾病的复杂性。例如,严重威胁人类健康
3、的慢性病多为复杂性疾病,其发生具有复杂的遗传和分子机制,受到基因、环境及其交互作用的影响,其病因学研究将产生大量的数据。②高通量技术的发展和基因组测序成本的下降。高通量测序技术可以对数百万个DNA进行同时测序,使得对一个物种的转录组和基因组进行细致全面的分析成为可能。随着人类基因组计划的完成和计算能力的快速发展,每个基因组的测序成本已从数百万美元降低至数千美元(并且还将继续降低)。这将产生海量测序数据(每个人的基因组就需要3G的数据存储量)。③医院信息化和IT业的迅速发展。人体本身就是生物医学大数据的一个重要来源,随着医院信息化和IT业的迅速发展,越来越多的人体数据能够获得储存
4、和利用。例如,X线、3D核磁、乳腺X线、3DCT扫描分别包括30M、150M、120M和1G的数据量,至2015年美国平均每家医院需要管理665T的数据量。生物医学大数据广泛涉及人类健康相关的各个领域:临床医疗、公共卫生、医药研发、医疗市场与费用、个体行为与情绪、人类遗传学与组学、社会人口学、环境、健康网络与媒体数据(表1)O表1生物医学大数据的主要来源数据来源貝体类型临床庚疗电子病历、庚学影像.咲疗设备监测等公共卫牛疾病与死广怪记、公共卫生监测、电子健康档案、食站销售、营养标签等医药研发临床试验、药物研发、医疗设备研发等医疗市场与费用庆疗服务费用、庆疗汝备销售记录、药店销售记
5、录、医疗保险等个休行为与悄绪实时视頻.个体行为、健身记录、体力活动记录、缺勤记录、传感器等人类遗传学与组学殛因组学.转录组学、蛋门质组学、代谢组学等社会人1」学性别.年蔽、姙姻状况.经济收人等环境休闲场所、污染、犯邪、交通等健康网络与媒体健廉网站、搜索引擎、通讯运肯商、微博、微信、论坛、即时通讯等1.生物医学大数据的应用:生物医学大数据可应用于以下方面。①开展组学研究及不同组学间的关联研究。从环境、个体生活方式行为等暴露组学,至个体细胞分子水平上的基因组学、表观组学、转录组学、蛋白组学、代谢组学、宏基因组学,再到个体健康和疾病状态的表型组学等。利用大数据将各种组学进行综合及整合
6、,既能为疾病发生、预防和治疗提供全面、全新的认识,也有利于开展个体化医学,即通过整合系统生物学与临床数据,可以更准确地预测个体患病风险和预后,有针对性地实施预防和治疗。②快速识别生物标志物和研发药物。利用某种疾病患者人群的组学数据,可以快速识别有关疾病发生、预后或治疗效果的生物标志物。在药物研发方面,大数据使得人们对病因和疾病发生机制的理解更加深入,从而有助于识别生物靶点和研发药物;同时,充分利用海量组学数据、已有药物的研究数据和高通量药物筛选,能加速药物筛选过程。②快速筛检未知病原和发现可疑致病微生物。通过采集未知病原样本,对病原进行测序,并将未知病原与已知病原的基因序列进行
7、比对,从而判断其为已知病原或与其最接近的病原类型,据此推测其来源和传播路线、开展药物筛选和相应的疾病防治。③实时开展生物监测与公共卫生监测。公共卫生监测包括传染病监测、慢性非传染性疾病及相关危险因素监测、健康相关监测(如出生缺陷监测、食品安全风险监测等)。此外,还可以通过覆盖全国的患者电子病历数据库进行疫情监测”,通过监测社交媒体或频繁检索的词条来预测某些传染病的流行。例如,GoogleTrends通过找寻"流感症状"和“流感治疗”之类搜索词的峰值,在医院急诊流感患者增加之前就能对某些地区的
此文档下载收益归作者所有