主成分分析
出典: フリー百科事典『ウィキペディア(Wikipedia)』
主成分分析(しゅせいぶんぶんせき)は、経済学の分野などが発祥の統計手法。複数の変数間の共分散(相関)を少数の合成変数で説明する手法。
- 例
- 市町村の人口・学校数・商業施設数・進学率・第一次産業の就業率・水道の普及率などには通常高い相関がある。この相関を1つの変数が作った偽相関と仮定し、数学的に算出する。それを第一主成分と呼ぶ。第一主成分は数学的な計算結果に過ぎない。これの意味を分析者が解釈し、たとえば「都市化指数」などと想定し、都市化の指標とする。その残差に対して同じ計算を適用して、主成分は第二、第三、と作れるがその変数間の関係を説明する主成分負荷量が小さくなっていくので、解釈困難になっていく場合が多い。
心理学やマーケティングで使われる因子分析は数学的には同一の手法。主成分分析は、因子分析の表現では「共通性1で回転しない主因子法」となる。数学的には同一のため、統計ソフト上は区別しない場合もある。
- 例
- 数学理科国語など5教科の点数には普通高い相関がある。これの第一主成分を取ると、5教科間の相関の7割程度を説明できたりする。解釈としては「学力(学習習慣・基礎知識・よい環境の連合体)」として、学力順に生徒のランキングを付けるために使用したりする。また第二主成分が残りの2割を説明できたとしてそれが国語・英語と数学・理科の負の相関を説明していたら「文系・理系」の区別を使う得点として使用したりする。
[編集] ソフトウェア
Excel NAG 統計解析アドイン Excelに主成分分析関数を追加。
[編集] 関連項目
カテゴリ: 統計学 | 数学関連のスタブ項目