基于文本挖掘的疾病辅助导诊技术研究

基于文本挖掘的疾病辅助导诊技术研究

ID:24766262

大小:51.50 KB

页数:7页

时间:2018-11-10

基于文本挖掘的疾病辅助导诊技术研究_第1页
基于文本挖掘的疾病辅助导诊技术研究_第2页
基于文本挖掘的疾病辅助导诊技术研究_第3页
基于文本挖掘的疾病辅助导诊技术研究_第4页
基于文本挖掘的疾病辅助导诊技术研究_第5页
资源描述:

《基于文本挖掘的疾病辅助导诊技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于文本挖掘的疾病辅助导诊技术研究第一章绪论1.1文本挖掘技术特征及发展趋势随着信息时代的到来,互联网的发展,使得信息产生,在互联网扩散的速度和规模呈几何级别增长,信息成倍增长的时间已经缩短到小时级别,信息规模空前膨胀,产生速度也日益加快,在互联网时代,每天全球各个地区的人们会用各自不同的语言,生产知识和信息数据,尤其是文本数据,各个垂直行业的数据积累量也成倍快速累积。由于信息的富集,其中的价值无可估量,各行各业包括医院、研究院、学校在内,如何能够将这些累积的数据有效地利用起来,如何通过自动化的工具进行挖掘处理,寻找这样的工具至关重要,在这样的背景下,文本挖掘技术

2、研究应运而生,当前,无论是在发达国家还是发展中国家,对文本挖掘技术的研究和突破从未停息。近30年来,许多国内外学者投身于文本挖掘领域的研究中,对文本挖掘本质的认识也日益深刻,然而由于文本挖掘(Text  基于文本挖掘的疾病辅助导诊技术研究第一章绪论1.1文本挖掘技术特征及发展趋势随着信息时代的到来,互联网的发展,使得信息产生,在互联网扩散的速度和规模呈几何级别增长,信息成倍增长的时间已经缩短到小时级别,信息规模空前膨胀,产生速度也日益加快,在互联网时代,每天全球各个地区的人们会用各自不同的语言,生产知识和信息数据,尤其是文本数据,各个垂直行业的数据积累量也成倍快速

3、累积。由于信息的富集,其中的价值无可估量,各行各业包括医院、研究院、学校在内,如何能够将这些累积的数据有效地利用起来,如何通过自动化的工具进行挖掘处理,寻找这样的工具至关重要,在这样的背景下,文本挖掘技术研究应运而生,当前,无论是在发达国家还是发展中国家,对文本挖掘技术的研究和突破从未停息。近30年来,许多国内外学者投身于文本挖掘领域的研究中,对文本挖掘本质的认识也日益深刻,然而由于文本挖掘(Text  基于文本挖掘的疾病辅助导诊技术研究第一章绪论1.1文本挖掘技术特征及发展趋势随着信息时代的到来,互联网的发展,使得信息产生,在互联网扩散的速度和规模呈几何级别增长

4、,信息成倍增长的时间已经缩短到小时级别,信息规模空前膨胀,产生速度也日益加快,在互联网时代,每天全球各个地区的人们会用各自不同的语言,生产知识和信息数据,尤其是文本数据,各个垂直行业的数据积累量也成倍快速累积。由于信息的富集,其中的价值无可估量,各行各业包括医院、研究院、学校在内,如何能够将这些累积的数据有效地利用起来,如何通过自动化的工具进行挖掘处理,寻找这样的工具至关重要,在这样的背景下,文本挖掘技术研究应运而生,当前,无论是在发达国家还是发展中国家,对文本挖掘技术的研究和突破从未停息。近30年来,许多国内外学者投身于文本挖掘领域的研究中,对文本挖掘本质的认识

5、也日益深刻,然而由于文本挖掘(TextMining,TM)是一个交叉学科,融合多方面的内容,如自然语言处理等等,来自不同领域的学者对TM的认识也不同,本文主要介绍从知识发现领域对TM的定义,学者Feldman对TM的定义如下,该定义己经得到普遍认可。文本挖掘(TM)也叫做从文本数据库中发现知识(Kno的处理对象不是有表存储结构的数据,而是非结构化的文本数据,无确定的形式和结构,并且没有机器可理解的语义。文本分类(TextCategorization,TC)是TM的主要技术之一,Sebastiani就机器学习角度对其定义如下:即将文本文档集,按照某种函数,也可以称之

6、为规则、假设或模型,分成不同的类别[2]。........1.2研究背景随着人们生活工作压力的增大,很大一部分人群长期处于亚健康状况,尤其是心脑血管疾病,有逐渐向年轻人群扩散的趋势,由于大部分人都不具备医疗相关知识,所以在出现相关症状后,很少有人能够及时地找到对症专科专家,进行进一步诊断。此外,医院和患者之间信息不对称也是导致门诊效率低下,就诊困难的因素之一,这使得初诊患者需要到医院咨询相关导诊医师,才能进一步找相关专科专家就诊。现代化的医疗需要一种可远程进行自助导诊的系统,能够帮助患者进行自助导诊,对所患疾病进行初步判断,从而减少挂错号、找错专科专家的概率。另一

7、方面,在医疗行业,随着医疗信息化的发展,积累了大量数据,其中绝大部分是电子文本数据,大量的信息资源中蕴含着具有潜在巨大价值的知识,亟待合适的工具去发现其中的价值,以指导医生诊断,患者就医,在提高医院门诊的工作效率的同时,也减少了患者的就诊时间和精力。医院累积的这些病例文本数据,为本文的研究奠定基础,提供了数据支持。目前网上现有的一些挂号系统,也有一些自助诊断的功能,但大多是专家系统,根据专家经验来判断出现某种症状如何寻找对症的专家专科,这样构建的系统需要大量专家,消耗大量的时间和精力去归纳总结出一条条规则,消耗的人力成本太高,不具备广泛应用的能力,而且没有输入一段

8、话进行初步

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。