データサイエンス基本(標本偏差と正規母集団)-統計学-
データサイエンスを学ぶために、基礎的な統計学を学びました。
復習も兼ねてメモしてみました。
見てくださった方のお役に立てたら幸いです。
標本平均
観測されたデータは、母平均に近いデータと考えられる。 |
複数のデータを観測し、その平均を標本平均と呼ぶ。 |
観測データを増やせば増やすほど、標本平均が母平均に近い可能性が高くなる。 |
正規母集団
正規母集団の母平均をμ、母標準偏差をσとし、そこから観測されるデータxのn個に対する標準平均/xの分布は、 正規分布であり、/xの分布の平均値はμのままだが、標準偏差はσ/√nと母集団に比べて√n分の1に縮む。 (正規母集団からの標本平均の性質) |
正規母集団からの標本平均の95%予言的中空間 母平均がμで母標準偏差がσの正規分布からのデータn個の標本平均/xに対する95%予言的中区間は6、 (μ-1.96σ/√n)以上(μ+1.96σ/√n)以下 |
正規母集団からの標本平均の95%予言的中空間:不等式表示 母平均がμで母標準偏差がσの正規母集団からのデータn個の標本平均/xに対する95%予言的中区間は、 -1.96<=(/x-μ)/(σ/√n)<=+1.96をx-について解いて得られる範囲である。 |