Written By mathew

データサイエンス基本(仮説検定と区間推定)-統計学-

ALL DataScience Study

データサイエンスを学ぶために、基礎的な統計学を学びました。
復習も兼ねてメモしてみました。

見てくださった方のお役に立てたら幸いです。

仮説検定と区間推定

仮説検定 正規分布している(あるいは正規分布で近似できる)
ある仮説の検証は、
その母数の母集団が正規分布していて、
その平均値μ、S.D.をσとしたとき、
観測されたデータxに対して不等式
-1.96<=(x-μ)/σ<=1.96が 成立するなら仮説は採択される。 不成立なら棄却される。
区間推定とは 母集団の母数に対して、その母数を仮定したとき観測されるデータの
「95%予言的中空間」に現実に観測されたデータが入るような母数だけを
集める推定の方法である。
区間推定によって定められた母数の範囲を「95%信頼区間」という。
区間推定で求められる区間は 検定の作業を全ての母数に関して実行し、採択されたものの集まりである。
正規母集団についてS.D.σが既知の時、未知の平均値μを区間推定する方法 観測されたデータxを用いて、μに関する1次不等式
-1.96<=(x-μ)/σ<=1.96を解いて、「*<=μ<=1.96」という形にする。
95%信頼区間とは 様々な観測値から同じ方法で区間推定すると、そのうちの95%は正しい母数を含んでいる区間のことである。