データサイエンス基本(無限母集団と散らばり)-統計学-
データサイエンスを学ぶために、基礎的な統計学を学びました。
復習も兼ねてメモしてみました。
見てくださった方のお役に立てたら幸いです。
無限母集団
無限母集団には、各データは無限個存在。 その観測しやすさはそれぞれ異なる。 |
ランダム・サンプリングの仮定とは、 十分な観測を行い、ヒストグラムにすると、 母集団の分布が再現されるという仮定。 |
母集団の平均値μを母平均といい、 μ=データの数値×相対度数の和 |
母集団のデータの散らばり具合
母集団のデータの散らばり具合を表す統計量が、 母標準偏差である。 |
母集団偏差の求め方 偏差=(データの数値)-(母平均μ) 母平均μ2乗={(偏差の2乗)×(池の広さ)}の合計 母標準偏差σ=√(母平均σ2乗) |