データサイエンス基本(基礎分析をする)-Pythonとjupyter-
データサイエンスを学ぶために、SIGNATEを始めました。
その中でjupyterでpythonのコマンドを入力するにあたり、復習も兼ねてメモしてみました。
見てくださった方のお役に立てたら幸いです。
基礎分析をする
基礎統計量をみる
AAA.describe()
欠損がないか見てみる
AAA.isnull().sum()
目的変数が1の人数を見てみる
AAA["y"].value_counts()
※yを目的変数とした場合。
説明変数と目的変数のクロス集計をする
pd.crosstab(AAA["accommodates"],AAA["y"],margins=True)
※accommodatesを説明変数、yを目的変数とした場合。
説明変数2をビニングしてみる
age_bining = pd.cut(AAA["age"],[0,20,30,40,50,60,100])
※ageを説明変数2とした場合。