ーーーー講義録始めーーーー
さて、統計分析を始める前に、分析対象となるデータがどのように得られるかを説明します。それは、先ほど述べたように、主に社会調査によって得られます。
社会調査にはさまざまな種類がありますが、ここでは、定型の質問紙を用いた調査、つまり一般的に「アンケート」と呼ばれる形式について説明します。
印刷教材の図表1-2をご覧ください。ここには、調査票に含まれる質問の例が記載されています。
最初の問1では、「あなたの性別はどれに該当しますか?」という質問が提示されています。次の問2では、「あなたは現在何歳ですか?」といった内容が記載され、各質問には番号が付けられています。
調査を受ける人、つまり調査対象者(回答者)は、これらの質問に対して回答を行います。回答方法としては、あらかじめ用意された選択肢から該当するものを選ぶ形式が多く見られます。ただし、質問によっては、選択肢を選ぶのではなく、回答者自身の言葉で回答する形式、いわゆる自由回答形式が用いられることもあります。
たとえば、問3では「あなたの仕事の内容を具体的に記述してください」といった指示があり、回答者が詳細を自由に書き込むよう求められます。このような自由回答も、データ化する際には、似たような回答をひとまとめにする作業が行われます。たとえば、「学校の先生」という回答と「生徒の教育」という回答は、「教員」という1つの職業区分にまとめられることがあります。
社会調査では、1人の回答者に対して、調査票に設定されたすべての質問に対する回答データが得られます。そして、これが回答者全員分集められることで、質問の数×回答者数分のデータが蓄積されます。
たとえば、質問が30問あり、回答者が1000人いる場合、30,000件ものデータが分析対象となります。このように膨大なデータは、適切に整理された形式で保存しておかないと、分析時に効率的に利用することが難しくなります。そのため、社会調査のデータは「回答者×回答内容」という形式のデータセットとしてまとめられます。
印刷教材の図表1-3をご覧ください。ここでは、先述の質問に対して500人分の回答が得られたと仮定した架空のデータが示されています。図表では、回答者ごとのデータが横方向に整理されており、たとえば3行目にあたる最初の回答者のデータには以下の情報が含まれています:
- 性別:女性
- 年齢:48歳
- 職業:美容師
- 特定の意見に対する回答:賛成
このように各行を横に見ることで、各回答者の情報を確認できます。そして、こうしたデータが500人分縦方向に並んでいます。
ここで、データを構成する要素として、「変数」と「値」という用語を説明します。変数とは、対象(回答者)ごとに異なる特性を表す要素を指します。この例では、「性別」「年齢」「職業」「意見に対する賛否」が変数に該当します。
一方、値とは、変数を構成する複数の特性や数値を指します。たとえば、「性別」という変数には「男性」「女性」「その他」の3つの値が含まれます。また、「年齢」という変数には23、35、48といったさまざまな数値が含まれます。ここで注意が必要なのは、「値」という用語は数量だけでなく、質的な特性も含むことです。
質問紙調査票に対応させると、それぞれの質問が変数に、回答選択肢や回答内容をまとめた区分が値に相当すると考えることができます。これらは統計分析の基礎用語として非常に重要ですので、まず覚えておいてください。詳細については次回の講義で説明します。