Written By mathew

データサイエンス基本(基礎分析をする)-Pythonとjupyter-

ALL DataScience Study

データサイエンスを学ぶために、SIGNATEを始めました。
その中でjupyterでpythonのコマンドを入力するにあたり、復習も兼ねてメモしてみました。

見てくださった方のお役に立てたら幸いです。

基礎分析をする

基礎統計量をみる

AAA.describe()

欠損がないか見てみる

AAA.isnull().sum()

目的変数が1の人数を見てみる

AAA["y"].value_counts()
※yを目的変数とした場合。

説明変数と目的変数のクロス集計をする

pd.crosstab(AAA["accommodates"],AAA["y"],margins=True)
※accommodatesを説明変数、yを目的変数とした場合。

説明変数2をビニングしてみる

age_bining = pd.cut(AAA["age"],[0,20,30,40,50,60,100])
※ageを説明変数2とした場合。