F-nameのブログ

はてなダイアリーから移行し、更に独自ドメイン化しました。

回帰分析の応用(2):決定係数、分散分析とF検定(社会統計学入門第12回)

検定の手段は共通点が多いようなので勉強を。

 

林拓也。回帰分析の応用。決定係数。分散分析とF検定。前回までのある連続変数を予測。回帰係数と定数が予測。決定係数は誤差の評価。推定された回帰式により大きく誤差がなくなれば。予測の精度を表す統計量。決定係数は回帰式により何%説明されるか。0から1。1なら100%予測。誤差がまったくない。0の場合は予測に全く役立たない。独立変数が無くても変わりがないこと。具体的計算手順。年齢と年収額のデータが11ケース。万円。従属変数の年収額の予測を。誤差を考える。独立変数がない場合の誤差や独立変数を含めた場合の誤差。独立変数がない場合は従属変数から。年収額の平均値は600。偏差に相当。それぞれのケースの偏差。縦軸に年収額を設定した散布図。独立変数の年齢の情報は加えていない。平均年収は600。11ケースの値の偏差。実際の年収額が400なら偏差は-200。データ全体として偏差平方和を。それぞれのケースで偏差の二乗が。40000。85600が合計額。全平方和と呼ぶ。偏差平方和や全平方和から分散を出せる。独立変数を入れる場合。従属変数の予測を。結果として得られた回帰式。Xに代入すると予測値が。年齢が30なら504。予測からの誤差は残差。予測値から差し引く。実測値の方が低いなど。右肩上がりの直線が回帰直線。回帰係数が傾き。各ケースの予測値が十字の記号で。残差も。残差の大きさはそれぞれの残差の二乗の合計を。それぞれのケースで。合計した値が示される残差平方和。回帰予測によっても残る誤差。2つの誤差から含めない場合と含めた場合の比較で評価を。残差平方和の方が誤差が減少。回帰平方和。何パーセント減少したか。回帰平方和から。年収額の散らばりが説明される。練習問題。全国調査のデータ。1週間の労働時間から年収額を。男性の場合、回帰平方和が求まる。決定係数は全兵法和で割る。女性の場合は決定係数を。男性の場合は0.4%が。女性の場合は21%。女性の場合はパートタイムで働く人が多いからの可能性。男性の場合は役職などの。他の独立変数も含めた重回帰分析を。
分散分析とF検定。決定係数を計算する時は。ある従属変数の散らばりを分けるのを分散分析。統計的検定を行うことも出来る。検定の対象となる。帰無仮説は独立変数を加えても。棄却されると独立変数の情報を加えれば誤差が少なくなるという対立仮説が。独立変数により説明された分散と説明されない分散。比を取る。平均平方。回帰平均平方。残差平均平方。検定統計量であるF比の計算。独立変数は1なので自由度は1。ケースの数は11。残差平方和を9で割る。2つの平均平方の比を。これがF比。分散分析表。平方和と自由度からF比を、表としてまとめる。回帰平均和など。それぞれの自由度。平均平方。回帰平均平方などからのF比。F分布による検定。F比により検定。帰無仮説は母集団において0。F分布に従う。2つの自由度により分布が異なる。回帰の自由度と残差の自由度。2つのF分布曲線。F分布を利用して出現確率を推定。回帰の自由度なども示せる。F分布表。2つの自由度に基づいて。回帰の自由度。残差の自由度。分子の自由度1と分母の自由度9。例の検定における限界値を評価から出す。帰無仮説が正しければF比は0に近い確率が高い。95%の範囲内。検定統計量のF比は限界値を越える。想定外になる。帰無仮説を棄却する事になり決定係数は0でないという対立仮説が採択。分析モデルが分析に有効であると。
分散分析の応用。原理は連続変数である従属変数を説明される分散とされない分散に。様々な応用が。グループ間の差の検定。平均の差のZ検定やt検定を。分散の比の。グループ数の限度はない。何故分散の比を?3つのグループから抽出された標本。各グループの平均。個体は近い部分に。グループ内の分散は小さい。標本が抽出されたグループ間の差が。グループ平均のバラツキは小さい。グループ間の分散とグループ内の分散の比。分散の比。3つのグループの母平均が同じであるならば分散の比は小さい。利用するデータは3グループごとの年収額。年収額の標本平均。母平均が違うか、分散分析とF検定を。全てのグループ間の母平均は同じとするのが帰無仮説。有意水準を5%とする。確率分布の限界値。F分布を用いる。2つの自由度で決まる。グループ間の平方和とグループ内の平方和からそれぞれの自由度を。F分布表。分子の自由度と分母の自由度の交差から限界値を出す。検定統計量を。分散分析表で求められるF比。グループ内平方和。グループ間の平方和。それぞれの平方和を自由度で割る。2つの平均平方の比を。検定統計量のF比。検定統計量は限界値を越えているので帰無仮説を棄却する。対立仮説が採択。どのグループで差があるかはわからない。多重比較という別の検定手段を。

 

社会統計学入門 (放送大学教材)

社会統計学入門 (放送大学教材)

  • 作者:林 拓也
  • 出版社/メーカー: 放送大学教育振興会
  • 発売日: 2018/03/01
  • メディア: 単行本