コルモゴロフ-スミルノフ検定
出典: フリー百科事典『ウィキペディア(Wikipedia)』
コルモゴロフ-スミルノフ検定(-けんてい、英:Kolmogorov-Smirnov test)は統計学における仮説検定の一種であり、有限個の標本に基づいて、2つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる。 しばしばKS検定と略される。
1標本KS検定は、経験分布を帰無仮説において示された累積分布関数と比較する。 主な応用は、正規分布および一様分布に関する適合度検定である。 正規分布に関する検定については、リリフォースによる若干の改良が知られている(リリフォース検定)。 正規分布の場合、一般にはリリフォース検定よりもシャピロ-ウィルク検定やアンダーソン-ダーリング検定の方がより強力な手法である。
2標本KS検定は、2つの標本を比較する最も有効かつ一般的なノンパラメトリック手法の1つである。 これは、この手法が2つの標本に関する経験分布の位置および形状の双方に依存するためである。
目次 |
[編集] 統計量
n個の標本y1,y2,...,ynに対する経験分布Fnは以下のように与えられる。
このとき、2つの片側KS検定統計量は、以下のように与えられる。
ここでF(x)は帰無仮説で提示される分布、またはもう一方の経験分布である。 2つの分布が等しいという帰無仮説が棄却されないと仮定する場合、上記の2つの統計量が従うべき確率分布は、仮説で提示される分布が連続分布である限りにおいて、分布の形に依存しない。
クヌースはこの1対の統計量に関する有意性を解析する方法に関する詳細な記述を与えている。 多くの人々は2つの統計量の代わりにmax(Dn+, Dn−)という統計量を用いるが、この統計量の分布はさらに扱いにくい。
[編集] 有意確率
この検定統計量の帰無仮説(両群の分布には差がない)下でのサンプル数Nが十分大きい場合の有意確率は で与えられる。
[編集] その他
1年のうちの1日や、あるいは1週間のうちの1日といったように、独立変数が周期性を持つ場合、カイパー検定の方がより適切である。 数値解析の有名な著作である"Numerical Recipes"には、このことに関する詳しい情報が記載されている。
さらに、コルモゴロフ-スミルノフ検定は分布の裾の部分よりも中央値付近の方に強く依存する。 これに対して、アンダーソン-ダーリング検定は裾でも中央値付近でも等しい感度を与える。
[編集] 関連項目
- アンドレイ・コルモゴロフ
- リリフォース検定
- シャピロ-ウィルク検定
- アンダーソン-ダーリング検定