[PYTHON/PANDAS] DataFrame 클래스 : groupby 메소드를 사용해 그룹 데이터 평균 계산하기
■ DataFrame 클래스의 groupby 메소드를 사용해 그룹 데이터 평균을 계산하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "v1" : [1, 3, 5, 7, 8, 3, 5, np.nan, 4, 5, 7, 9], "v2" : [11, 33, 55, 77, 88, 33, 55, np.nan, 44, 55, 77, 99], "by1" : ["red", "blue", 1, 2, np.nan, "big", 1, 2, "red", 1, np.nan, 12], "by2" : ["wet", "dry", 99, 95, np.nan, "damp", 95, 99, "red", 99, np.nan, np.nan] } ) dataFrameGroupBy1 = dataFrame1.groupby(["by1", "by2"]) dataFrameGroupBy2 = dataFrameGroupBy1[["v1", "v2"]] dataFrame2 = dataFrameGroupBy2.mean() print(dataFrame2) """ v1 v2 by1 by2 1 95 5.0 55.0 99 5.0 55.0 2 95 7.0 77.0 99 NaN NaN big damp 3.0 33.0 blue dry 3.0 33.0 red red 4.0 44.0 wet 1.0 11.0 """ |
▶ requirements.txt
1 2 3 4 5 6 7 8 |
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas