データサイエンス基本(仮説検定と区間推定)-統計学-
データサイエンスを学ぶために、基礎的な統計学を学びました。
復習も兼ねてメモしてみました。
見てくださった方のお役に立てたら幸いです。
仮説検定と区間推定
仮説検定 | 正規分布している(あるいは正規分布で近似できる) ある仮説の検証は、 その母数の母集団が正規分布していて、 その平均値μ、S.D.をσとしたとき、 観測されたデータxに対して不等式 -1.96<=(x-μ)/σ<=1.96が 成立するなら仮説は採択される。 不成立なら棄却される。 |
区間推定とは | 母集団の母数に対して、その母数を仮定したとき観測されるデータの 「95%予言的中空間」に現実に観測されたデータが入るような母数だけを 集める推定の方法である。 区間推定によって定められた母数の範囲を「95%信頼区間」という。 |
区間推定で求められる区間は | 検定の作業を全ての母数に関して実行し、採択されたものの集まりである。 |
正規母集団についてS.D.σが既知の時、未知の平均値μを区間推定する方法 | 観測されたデータxを用いて、μに関する1次不等式 -1.96<=(x-μ)/σ<=1.96を解いて、「*<=μ<=1.96」という形にする。 |
95%信頼区間とは | 様々な観測値から同じ方法で区間推定すると、そのうちの95%は正しい母数を含んでいる区間のことである。 |