■ DataFrame 클래스의 to_parquet 메소드를 사용해 PARQUET 파일을 생성하는 방법을 보여준다.
▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
import pandas as pd import numpy as np datetimeIndex = pd.date_range("2000/01/01", periods = 1000) dataFrame = pd.DataFrame( np.random.randn(1000, 4), index = datetimeIndex, columns = ["A", "B", "C", "D"] ) dataFrame.to_parquet("test.parquet") |
▶ requirements.txt
1 2 3 4 5 6 7 8 9 10 11 12 13 |
cramjam==2.9.0 fastparquet==2024.5.0 fsspec==2024.10.0 numpy==2.1.3 packaging==24.2 pandas==2.2.3 pyarrow==18.0.0 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas pyarrow fastparquet 명령을 실행했다.