■ DataFrame 클래스의 pivot 메소드에서 columns/values 인자를 사용해 LONG 포맷 데이터에서 WIDE 포맷 데이터를 구하는 방법을 보여준다.
▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
import pandas as pd dataFrame1 = pd.read_csv("air_quality_long.csv", index_col = "date.utc", parse_dates = True) # 5272건 dataFrame2 = dataFrame1[dataFrame1["parameter"] == "no2"] # 3447건 dataFrame3 = dataFrame2.sort_index() # 3447건 dataFrameGroupBy = dataFrame3.groupby(["location"]) dataFrame4 = dataFrameGroupBy.head(2) # location 컬럼 그룹별로 2개씩 표시한다. dataFrame5 = dataFrame4.pivot(columns = "location", values = "value") print(dataFrame5) """ location BETR801 FR04014 London Westminster date.utc 2019-04-09 01:00:00+00:00 22.5 24.4 NaN 2019-04-09 02:00:00+00:00 53.5 27.4 67.0 2019-04-09 03:00:00+00:00 NaN NaN 67.0 """ |
▶ requirements.txt
1 2 3 4 5 6 7 8 |
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을 실행했다.