今回の講義はPandasの操作に関する問題を出されて
それを実際にコードを書いて解いていくという内容です。
特定のテーマに沿った課題に取り組みながら
スキルを向上させていきます。
前準備として、問題に出てくるデータは下記URLから
ダウンロードしておく必要があります。
https://drive.google.com/drive/folders/1oKCLH1D_KXVLJFutxtP1dvzgWNYtoqVi
Pandas 20本ノック
問題その15 ユニークな値と出現回数
iris.csvを読み込みdf_irisと定義してください。
その後、df_irisのClassカラムにおいて、ユニークな値と
その出現回数を確認してください。
とりあえず、pandas インポート、
read_csvでファイルの読み込みをします。
import pandas as pd
df_iris = pd.read_csv('iris.csv')
df_iris.head()
pandas の series関数である
value_counts() ←ユニークな値とその出現回数を確認
を使用するそうです。
実装するとこんな感じです。
df_iris['Class'].value_counts()
Iris-virginica 53
Iris-versicolor 53
Iris-setosa 50
Name: Class, dtype: int64
問題その16 グループごと集計
df_irisの下記各クラスにおける
sepal-length, sepal-width, petal-length, ptetal-width
の平均値を求めてください。
・Iris-virginica
・Iris-versicolor
・Iris-setosa
グループごとの集計を行うには
groupby() グループごとの集計
を使用するそうです。今回は平均値を求めるのでmeanと組み合わせます。
df_iris.groupby('Class').mean()
コメント