欢迎来到天天文库
浏览记录
ID:22718054
大小:134.50 KB
页数:5页
时间:2018-10-31
《《相関系数》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、データ分析について相関係数2つの異なる変数に関するn個のデータ(xi、yi)、1≦i≦nが得られた時、yとxの相関関係を考える。ここでデータ数は最低でも5個以上であることが望ましい。平均値 = 、 =標準偏差 = 、 =相関係数 r=相関係数の意味: r = 1 yとxには正の相関がある → yとxは傾きが正の直線関係にある。 r = -1 yとxには負の相関がある → yとxは傾きが負の直線関係にある。 r = 0 yとxには相関がない。rの検定:帰無仮説*「yとxには相関がない」を設定すると、データの個数
2、nに依存するrの理論分布が求められる(0を中心とする正規分布のような分布)。rの分布から5%棄却限界値(両側検定**)のr0を求め、|r|>r0なら、帰無仮説は棄却され、対立仮説「yとxは相関がある」が採択される。*帰無仮説: あらかじめ成立しないと想定した仮説 → 背理法。対立仮説: 本来成立し、実証したいと思っている仮説。帰無仮説に反するので対立仮説と呼ばれる。帰無仮説が棄却されるか、あるいは対立仮説に基づく統計量の値が5%限界値を超えなければ、対立仮説は支持される。**両側検定:分布の両側で検定する。r>r0(正の相関
3、)か、r<-r0(負の相関)の時に帰無仮説を棄却するので、5%の場合はrの表で2.5%のところの値をr0とする。片側検定の時は(例えば、帰無仮説「正の相関がない」)、5%のところの値を用いる。n=10の時、両側検定で0.025(2.5%)のところのr0の値は0.632。したがって、求められたr>0.632なら棄却される。すなわち正の相関が認められる。52(カイ2乗)検定2 分布: 2個以上の項目について異なる結果を持つ事象を観測した時、観測値と観測値に関する事前の期待値(理論値または推定値)との誤差の2乗和は2 分布に従うこ
4、とが分かっている。具体的には oi: 項目iの観測値(度数)、 ei: 項目iの期待値(度数)2 = が自由度=n-1の2 分布に従う。2 の値が小さいほど観測値は期待通りである。自由度: 項目の総数nと観測度数の総数 O=は定まっているので、すべてのoiが自由に表れることはない。たとえば、onの値はon=O-のように他のn-1個の値から決まってしまう。自由に表れることが出来る項目の個数n-1を自由度という。2 検定:項目の度数についてのある仮説があって、仮説により期待値が分かる場合、2 検定により仮説の正しさを統計
5、的に実証できる。すなわち2の値が小さければ、観測結果は仮説通りで、仮説は正しいと推定される。2の値は2 分布に従うので、棄却限界値を定めて、限界値より2の値が大きければ、仮説を棄却する。限界値として5%限界値を選ぶことが多い。5%限界値とは、この値より大きい2の値が観測される確率はわずか5%であるということを意味する。この5%の確率のことを有意水準といい、確率が5%以下のとき有意であるという。例1: あるサイコロを600回投げて、次の観測結果を得た。仮説「このサイコロは精密である」設定する(この場合、帰無仮説は「このサイコロ
6、は精密でない」である)。仮説によれば、各サイコロの目の期待度数(理論値)は100ずつのはずである。表1:サイコロ投げの実験結果サイコロの目123456o:出た目の度数1179388106111855e:期待度数100100100100100100表1から、2 =8.64、自由度=5.自由度5の2分布の5%限界値は11.07(=5、P=0.05の箇所の値)なので、2 <11.07となり、仮説を採択できる。例2: 丁寧体の比率はジャンルによって異なり、例えば新聞記事と学術論文を比べた時、新聞記事の方が丁寧体の比率は高いに違いない
7、と思われるので、実証したい。新聞記事と学術論文に表れる文の内の丁寧体の数を調べて表2の結果を得た。表2:新聞記事と学術論文の「です」「ます」文の数文体ですます文の総数新聞記事160165645学術論文6570354この例の場合、例1と異なり、それぞれの文数の理論値が分からないが以下のように観測結果から、仮説を立てて推定値を求めることが出来る。帰無仮説を「丁寧体の比率はジャンルと独立であるとする」。このとき、期待度数を推定して、表2を表3のように書き換えることが出来る。表3:ジャンルによる丁寧体と非丁寧体の文数文体です・ますそ
8、れ以外総数新聞記事o:325e:(297)*320(348)645学術論文o:135e:(163)219(191)354総数460539999(*括弧内は期待度数の推定値→ 460x645/999=297)例えば、新聞記事における丁寧体(「です・ます」の文数)は、帰無仮説によれば、新聞記事
此文档下载收益归作者所有