Python 無料で独習 【超特訓】Pandas20本ノック 07

Python
この記事は約2分で読めます。

今回の講義はPandasの操作に関する問題を出されて
それを実際にコードを書いて解いていくという内容です。

特定のテーマに沿った課題に取り組みながら
スキルを向上させていきます。
前準備として、問題に出てくるデータは下記URLから
ダウンロードしておく必要があります。
https://drive.google.com/drive/folders/1oKCLH1D_KXVLJFutxtP1dvzgWNYtoqVi

Pandas 20本ノック

問題その15 ユニークな値と出現回数

iris.csvを読み込みdf_irisと定義してください。
その後、df_irisのClassカラムにおいて、ユニークな値と
その出現回数を確認してください。

とりあえず、pandas インポート、
read_csvでファイルの読み込みをします。

import pandas as pd
df_iris = pd.read_csv('iris.csv')
df_iris.head()

pandas の series関数である
value_counts()  ←ユニークな値とその出現回数を確認
を使用するそうです。
実装するとこんな感じです。

df_iris['Class'].value_counts()

Iris-virginica     53
Iris-versicolor    53
Iris-setosa        50
Name: Class, dtype: int64

問題その16 グループごと集計

df_irisの下記各クラスにおける
sepal-length, sepal-width, petal-length, ptetal-width
の平均値を求めてください。
・Iris-virginica 
・Iris-versicolor 
・Iris-setosa

グループごとの集計を行うには
groupby() グループごとの集計
を使用するそうです。今回は平均値を求めるのでmeanと組み合わせます。

df_iris.groupby('Class').mean()

コメント

タイトルとURLをコピーしました