推計統計学
出典: フリー百科事典『ウィキペディア(Wikipedia)』
推計統計学(すいけいとうけいがく、inferential statistics)とは、無作為抽出された部分集団(抽出集団、標本集団)から抽出元全体(母集団)の特徴、性質を推定する統計学の分野である。推測統計学または推計学とも呼ばれる。
統計学的推定は
- 点推定
- 区間推定
- 仮説検定
に細分される。 抽出集団から母集団を推定するため、抜き取り調査による品質管理や疫学調査の基礎となる学問である。
なお、現代の推計統計学理論は、母集団を規定するパラメータ(母数)を既定のものとしてそれを推定するという方針に基づいて発展を遂げてきたが、それに対し、パラメータを確率変数として考えるベイズ統計学が最近注目されている。
目次 |
[編集] 点推定
抽出集団のデータを用いて母集団の分布を表現するパラメータを点として推定すること。
正規分布の場合二つのパラメーターで分布が表現され、それぞれ平均値と標準偏差である。 通常推定値は記号に「^」をつける。 推定標準偏差は標準偏差の項で示される標本分散ではなく不偏分散を用いる。 推定平均値、推定標準偏差は以下の式で算出される。
母集団が歪んでいる場合など、平均値で対称になっていない場合、平均値を用いるよりも中央値や最頻値を用いたほうがその分布の特徴を捉えやすい場合がある。
[編集] 区間推定
点推定で推定したパラメータのバラツキや信頼区間を示すこと。
正規分布の場合には標準誤差(SE, Standard Error)を用いることが多い。平均値の標準誤差を特にSEM (standard error of the mean)と呼ぶ。 SEMは以下の式で算出される。
また、より具体的に信頼区間(95%信頼区間、99%信頼区間などが用いられる)を表示することもある。
[編集] 仮説検定
区間推定値から、母集団が特定の分布に従っているかどうかを検証すること。
具体的には、データが特定の分布に従う母集団から抽出されたとする仮説を立て、この仮説の検定を行う。この仮説を帰無仮説(きむかせつ)という。たとえば、「抽出集団は、平均値50、標準偏差○の母集団から抽出されたものである。」とか「抽出集団Aと抽出集団Bはともに平均値、標準偏差が99%同じ母集団から抽出されたものである。」といった仮説が帰無仮説となる。こうした帰無仮説から予想される統計量と、実際に抽出集団のデータから計算された統計量が一致する確率(p値という)を求め、その確率が予め決めた基準(有意水準、5%と1%が使用されることが多い)よりも小さい(つまり「起こりそうもない」)場合には「有意差がある」として、上の仮説は棄却される。
仮説検定には様々な手法があり、帰無仮説により使い分ける必要がある。
[編集] 検定手法
統計学的検定手法は、データが特定の確率分布に従うことを仮定する「パラメトリックな手法」と、それを仮定しない「ノン・パラメトリックな手法」に分けられる。
- パラメトリックな検定手法
- ノン・パラメトリックな検定手法
- Wilcoxon検定 (U検定)
- カイ二乗検定
- フィッシャーの正確確率検定
カテゴリ: 自然科学関連のスタブ項目 | 統計学