数据处理方法

数据处理方法

ID:18948310

大小:190.00 KB

页数:10页

时间:2018-09-22

数据处理方法_第1页
数据处理方法_第2页
数据处理方法_第3页
数据处理方法_第4页
数据处理方法_第5页
资源描述:

《数据处理方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据处理方法摘要:数据处理是对数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程。关键词:方式数据处理最小二乘法和一元线性回归实时处理

2、方式作图法1.方式根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。数据处理主要有四种分类方式①根据处理设备的结构方式区分,有联机处理方式和脱机处理方式。②根据数据处理时间的分配方式区分,有批处理方式、分时处理方式和实时处理方式。③根据数据处理空间的分布方式区分,有集中式处理方式和分布处理方式。④根据计算机中央处理器的工作方式区分,有单道作业处理方式、多道作业处理方式和交互式处理方式。2.数据处理对数据

3、(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应用领域中,数值计算所占比重很小,通过计算机数据处理进行信息管理已成为主要的应用。如侧绘制图管理、仓库管理、财会管理、交通运输管理,技术情报管理、办公室自动化等。在地理数据方面既有大量自然环境数据(土地、水、气候、生物等各类资源数据),也有大量社会经济数据(人口、交通、工农业等),常要求进行综合性数据处理。故需建立地理数据库,系统地整理和存储地理数据减少冗余,发展数据处理软件,充分利用数据库技术进行数

4、据管理和处理。3.最小二乘法和一元线性回归从测量数据中寻求经验方程或提取参数,称为回归问题,是实验数据处理的重要内容。用作图法获得直线的斜率和截距就是回归问题的一种处理方法,但连线带有相当大的主观成分,结果会因人而异;用逐差法求多项式的系数也是一种回归方法,但它又受到自变量必须等间距变化的限制。本节介绍处理回归问题的又一种方法――最小二乘法。一、拟合直线的途径1.问题的提出假定变量x和y之间存在着线性相关的关系,回归方程为一条直线y=b0+b1x(8)由实验测得的一组数据是xk、yk(k=1,2,…,n),我们的任务是根据这组数据拟合出(8)式的直线,即

5、确定其系数b0、b1。我们讨论最简单的情况,假设(1)系统误差已经修正;(2)n次测量的条件相同,所以其误差符合正态分布,这样才可以使用最小二乘法原理;(3)只有yk存在误差,即把误差较小的最为变量x,使不确定度的计算变得简单。1.解决问题的途径――最小二乘法原理由于测量的分散性,实验点不可能都落在一条直线上,如图3。相对于我们所拟合的直线,某个测量值yk在y方向上偏离了vk,vk就是残差vk=yk-y=y-(b0+b1xk)联想到贝塞尔公式如果的值小,那么标准偏差s(y)就小,能够使s(y)最小的直线就是我们所要拟合的直线。这就是最小二乘原理。最小二乘

6、原理:最佳值乃是能够使各次测量值残差的平方和为最小值的那个值。由(9)式可见,b0和b1决定vk的大小,能够使为最小值的b0、b1值就是回归方程的系数。二.回归方程的系数1.用最小二乘原理求回归方程的系数(10)使∑v²k为最小值,极小值条件是一级导数等于零和二级导数大于零。这里xk、yk是测量值,变量b0和b1,(10)式分别对b0和b1求偏导数(11)整理后得(12),,,解联立方程(12),得到(13)(14)估计值,于是就求得了回归方程(8)。2.为了便于记忆和用计算器或计算机编程计算,引入符号(15)很容易证明于是(17)3.测量点的重心重心。

7、理解这点,有助于用作图法处理数据时的连线。三、回归方程系数的标准偏差1.yk的标准偏差由(12)式,我们很容易求得yk的标准偏差(18)式中分母n-2是自由度,可以作如下解释:两点决定一条直线,只需测量两个点,即可解出直线的斜率和截距,现在多测了n-2个点,所以n-2是自由度。s(y)是因变量yk的标准偏差,在满足本节开始的三个假设的条件下,我们可以对照测量列的标准偏差的意义来理解s(y):对于自变量的某一个取值,因变量是直线上相应的一个点,在重复条件下作任意次测量,实测点落在与直线上相应的距离在s(y)范围以内的概率是68。3%。s(y)描述了测量点对

8、于直线的分散性。2.回归方程系数的标准偏差(1)b1的标准偏差s(b1)我们的任

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。