スピアマンの順位相関係数
出典: フリー百科事典『ウィキペディア(Wikipedia)』
スピアマンの順位相関係数(じゅんいそうかんけいすう)は統計学において順位データから求められる相関の指標である。チャールズ・スピアマンによって提唱され、ふつうρ と書かれる。
ピアソンの積率相関係数(普通に相関係数と呼ばれるもの)と違い、ノンパラメトリックな指標である。すなわち2つの変数の分布について何も仮定せずに、変数の間の関係が任意の単調関数によってどの程度忠実に表現できるかを、評価するものである。「変数間の関係は線形である」と仮定する必要も、また変数を数値的にとる必要もなく、順位が明らかであればよい。
原理的にはρ はピアソンの積率相関係数の特別な(相関係数を計算する前にデータを順位に変換した)場合に当たる。しかしρ を計算するには普通もっと単純な手順が用いられる。生のスコアを順位に変換し、各観察(各ペア)における2つの変数の順位の差D を計算する。ρ は:
で求められる。ただしここで
- D = 対応するX とY の値の順位の差
- N = 値のペアの数
である。
同順位(タイ)がある場合には、X、Y における同順位の個数をそれぞれnx 、ny 、それらの順位をti 、tj (i = 1, 2, ... , nx ;j = 1, 2, ... , ny )として、以下の式を用いる:
しかし同順位が少なければそれらを無視して最初の式を用いても影響は小さい。
[編集] 検定
ρ の観察値が有意に0と異なるかどうかを検定するには、観察値をある有意水準に対して数表と比較する方法でできる。
標本数が約20以上の場合、変数:
をとると、これは帰無仮説(相関なし)を立てる場合にはスチューデントのt分布に従う。
帰無仮説を立てない場合もある。これは観察されたρ がある値と有意に異なるかどうか、または2つの観察されたρ が互いに有意に異なるかどうかを検定する場合であるが、この場合にもt分布が利用されるものの、検出力ははるかに低くなる。