F-nameのブログ

はてなダイアリーから移行し、更に独自ドメイン化しました。

データの基礎集計(1)(社会統計学入門第2回)

変数の性質は誤って理解しがち。騙しのテクニックでも使われるかもしれないので注意。

 

変数の性質。分布を。度数分布表。
変数とは?社会調査では様々な質問の回答を分析。どの程度満足しているか。回答はそれぞれ異なる。調査対象者によって値が変化、変数。データを統計的に分析する際には、様々な変数を用いる。日本は学歴社会か?済む人に調査を。学歴と年収との関係を見る。学歴と年収が変数になる。その関連をみる。変数を扱う際の注意点。変数には測定の手法に応じた区分がある。変数の区分。離散変数と連続変数。大きな区分。離散変数。区別するために境界線をつけることが出来る。性別という変数。男性と女性。測定した値をカテゴリーに出来る。順序付けができないものとできるもの。順序付けができない、カテゴリーに順序をつけられない。性別や国籍、宗教など。順序付けが可能な離散変数。英語の成績について、1優、2良、3可、4不可。社会調査について度々出る。生活への満足度。満足の度合いを順序のカテゴリーで。連続変数。対象の状態を数字で示す。年齢や体重。煙草を吸う量など。英語のテストの点数。点、という単位で。便宜的に値をどこまでも細分化することが可能。分析方法と密接に関連。離散変数と連続変数の注意点。しばしば混同して用いられる。順序付け可能な離散変数を連続変数としてしまうことが多い。満足度を得点として連続変数とするなど。あくまで主観的なものを数値化しているだけ。よく出てくる。尺度。名義尺度、順序尺度など。測定の水準に基づく。離散変数と連続変数にほぼ対応。名義尺度は順序付け不能な離散変数。順序尺度は順序付け可能な離散変数。真のゼロ点、0という数値が。重さ0グラム。重さが無いことを表す。身長や年月なども同様。気温。0度というのは気温が無くなることを意味するのではない。Cは温度の間隔を表すだけ。間隔尺度。比率尺度。気温1度と2度を、2倍の重さという訳ではない。
社会調査でデータを収集して最初に行うのは、データの特性を確認すること。度数分布表を。離散変数に対して。連続変数でも作成可能だが、殆どそのような分析は行わない。1賛成2やや賛成3やや反対4反対、順序付け可能な離散変数。度数の列。それぞれのカテゴリーに属する。外国人が増えることに賛成ですか、という問いに19人など。回答者の合計、度数。度数の値から、やや反対の人が一番多いことが分かる。度数のデータだけでも何処に集中しているのかは分かるが、他の調査と比較するのに不便なことも。意見の分布はどのように異なるか?相対度数。全体の度数を100や1000などにした場合の。%の単位で表す比率。各度数の数を全体の数で割る。100で掛けることで%に。百分率。百分率度数分布。百分率度数分布表を地域で比較。B市のほうが極端な意見が多いなど。単純に度数で比較したのでは分からないことを理解することが出来る。場合によっては図で表した方が、結果が分かりやすい。
棒グラフ。それぞれのカテゴリーの度数または百分率を棒の形で表現。差が大きい場合、視覚的効果がある。順序付けがないことが前提なので、棒を隣接させずに書く。ヒストグラム。度数または百分率を棒の形で。それぞれのカテゴリーを表す棒がくっついている。順序があることを示す。外国人への賛否。互いの棒がくっついている。度数多角形。百分率または度数を線で結ぶ。折れ線グラフ。カテゴリーの間に順序がある場合に。百分率を線で。複数の調査結果を比較するのに優れている。分布を表す方法は様々。状況に応じて。累積して示すことも出来る。累積度数分布表。累積百分率。

 

社会統計学入門 (放送大学教材)

社会統計学入門 (放送大学教材)