マンガでわかる統計学 因子分析編

マンガでわかる統計学 因子分析編
高橋 信 井上 いろは トレンド・プロ
オーム社
売り上げランキング: 5185
おすすめ度の平均: 5.0
5 因子分析が本当に分からなくてあきらめている人向け
5 統計な苦手な方でも分かりやすい。
5 内容は非常に高度!!!
5 このシリーズのいいところ
4 専門書より切れ味最高!

概要

本書では、アンケートの基礎知識、数学的な基礎知識、主成分分析、因子分析を
学ぶことができる。

内容

標本抽出法

・単純無作為抽出法
 母集団から無作為に固体を抽出する方法
 ※対象データすべてを用意しないといけないため、現実ではこの方法は難しい
・層別抽出法
 母集団を「都道府県」とか「年代」とかといった切り口で層にわけて、層ごとに単純無作為抽出法をやる
  層の違いで回答に大きく偏りが出そうな状況の時に適した方法。
  ただし、これも全部のデータ必要
・2段抽出法
 1. ある決まり(たとえば年代とか)でデータを分ける
 2. 1で分けた種類のデータごとにランダムでいくつか抽出する
 3. 2で抽出した層に対して、無作為抽出法を行う。
 ※この方法は、全部のデータではなく抽出した層のデータを集めればよいので、
  実践的
・層別2段抽出法
 層別抽出法と、2段抽出法を組み合わせた方法
 1. 層別にデータを分ける
 2. 1で分けた層ごとにランダムに、いくつか抽出する
 3. 2で抽出した層に対して、無作為抽出法を行う。
 ※この方法は、全部のデータではなく抽出した層のデータを集めればよいので、
  実践的
 例) 全国であるアンケートを行いたいとして、対象者を抽出する。
 1. 都道府県で分ける
 2. 任意の県(例えば埼玉県)ごとにいくつかの市や区をピックアップする
 3. 2でピックアップした市や区に対して、無作為抽出方を行い対象者を選び出す
 4.これを全国で行う
 → 1番実践的。用意するデータが限られるため。

数学的な基礎知識

 相関行列、単位行列、回転、固有値固有ベクトル、対象行列、偏差平方和・分散・標準偏差

主成分分析

 総合力トップのデータを見つけ出す手法
 例えば総合力トップの映画を見つけるとして、「観客動員数」と「DVD売り上げ枚数」と「評論家の評価点」のデータがあると
 した場合に、それらを加味してトップの映画を見つける事ができる。

因子分析

 データの背後に潜む説明変数を見つけ出す分析手法
 例えば、
 「就職先を決めるにあたり重視すること」を全国の学生に5段階で聞き
 答える項目として「有名である」「新人教育がしっかりしている」「伝統がある」…などがあるとする。
 それらアンケートの答えより
  ・自分の能力を高めてくれるか
  ・安定しているか
  ・即戦力として扱ってくれるか
 などの思いが影響しているという事を見つけ出すことができる。
 ただ、上記の「自分の能力を高めてくれるか」というものは、
 きっと世の中に存在するに違いない「データの背後に潜む説明変数」だ、と考える。
 これらの説明変数を見つけ出す分析手法が、因子分析になる。

感想

因子分析で特徴を現す言葉まで、見つけることができるとおもったが
言葉は分析者が決めなければならない。
この言葉の定義まででてくると、BLOGごとに特徴を現す言葉でグルーピングできて良いと思うが、
他の方法と組み合わせないとそのような事はできなさそうで残念。