■ DataFrame 클래스의isna 메소드를 사용해 특정 컬럼 값이 NaN인 데이터를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
|
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "col1" : ["A", "B", np.nan, "C", "D"], "col2" : ["F", np.nan, "G", "H", "I"] } ) print(dataFrame1) """ col1 col2 0 A F 1 B NaN 2 NaN G 3 C H 4 D I """ print() dataFrame2 = dataFrame1[dataFrame1["col2"].isna()] print(dataFrame2) """ col1 col2 1 B NaN """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install
더 읽기
■ DataFrame 클래스에서 [] 연산자를 사용해 특정 컬럼에서 특정 값들을 갖는 DataFrame 객체를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
|
import pandas as pd url = "https://raw.githubusercontent.com/pandas-dev/pandas/main/pandas/tests/io/data/csv/tips.csv" dataFrame1 = pd.read_csv(url) dataFrame2 = dataFrame1[(dataFrame1["size"] >= 5) | (dataFrame1["total_bill"] > 45)] print(dataFrame2) """ total_bill tip sex smoker day time size 59 48.27 6.73 Male No Sat Dinner 4 125 29.80 4.20 Female No Thur Lunch 6 141 34.30 6.70 Male No Thur Lunch 6 142 41.19 5.00 Male No Thur Lunch 5 143 27.05 5.00 Female No Thur Lunch 6 155 29.85 5.14 Female No Sun Dinner 5 156 48.17 5.00 Male No Sun Dinner 6 170 50.81 10.00 Male Yes Sat Dinner 3 182 45.35 3.50 Male Yes Sun Dinner 3 185 20.69 5.00 Male No Sun Dinner 5 187 30.46 2.00 Male Yes Sun Dinner 5 212 48.33 9.00 Male No Sat Dinner 4 216 28.15 3.00 Male Yes Sat Dinner 5 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
더 읽기
■ DataFrame 클래스에서 [] 연산자를 사용해 특정 컬럼에서 특정 값들을 갖는 DataFrame 객체를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
|
import pandas as pd url = "https://raw.githubusercontent.com/pandas-dev/pandas/main/pandas/tests/io/data/csv/tips.csv" dataFrame1 = pd.read_csv(url) dataFrame2 = dataFrame1[(dataFrame1["time"] == "Dinner") & (dataFrame1["tip"] > 5.00)] print(dataFrame2) """ total_bill tip sex smoker day time size 23 39.42 7.58 Male No Sat Dinner 4 44 30.40 5.60 Male No Sun Dinner 4 47 32.40 6.00 Male No Sun Dinner 4 52 34.81 5.20 Female No Sun Dinner 4 59 48.27 6.73 Male No Sat Dinner 4 116 29.93 5.07 Male No Sun Dinner 4 155 29.85 5.14 Female No Sun Dinner 5 170 50.81 10.00 Male Yes Sat Dinner 3 172 7.25 5.15 Male Yes Sun Dinner 2 181 23.33 5.65 Male Yes Sun Dinner 2 183 23.17 6.50 Male Yes Sun Dinner 4 211 25.89 5.16 Male Yes Sat Dinner 4 212 48.33 9.00 Male No Sat Dinner 4 214 28.17 6.50 Female Yes Sat Dinner 3 239 29.03 5.92 Male No Sat Dinner 3 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
더 읽기
■ read_csv 함수를 사용해 인터넷상의 CSV 데이터 파일을 로드하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
|
import pandas as pd url = "https://raw.githubusercontent.com/pandas-dev/pandas/main/pandas/tests/io/data/csv/tips.csv" dataFrame = pd.read_csv(url) print(dataFrame) """ total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 .. ... ... ... ... ... ... ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 [244 rows x 7 columns] """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을
더 읽기
■ Series 클래스의 astype 메소드를 사용해 범주형 데이터 타입으로 변환하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
|
import pandas as pd series1 = pd.Series([1, 2, 3, 2, 2, 3]) series2 = series1.astype("category") print(series2) """ 0 1 1 2 2 3 3 2 4 2 5 3 dtype: category Categories (3, int64): [1, 2, 3] """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas
더 읽기
■ cut 함수를 사용해 연속형 데이터를 구간(범주형)으로 나누는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
|
import pandas as pd series1 = pd.Series([1, 2, 3, 4, 5, 6]) series2 = pd.cut(series1, 3) # 3개의 구간을 구한다. """ 0 (0.995, 2.667] 1 (0.995, 2.667] 2 (2.667, 4.333] 3 (2.667, 4.333] 4 (4.333, 6.0] 5 (4.333, 6.0] dtype: category Categories (3, interval[float64, right]): [(0.995, 2.667] < (2.667, 4.333] < (4.333, 6.0]] """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을 실행했다.
■ DataFrame 클래스의 groupby 메소드를 사용해 그룹 데이터의 합계를 계산하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
|
import pandas as pd dataFrame = pd.DataFrame( { "Animal" : ["Animal1", "Animal2", "Animal3", "Animal2", "Animal1", "Animal2", "Animal3"], "FeedType" : ["A", "B", "A", "A", "B", "B", "A"], "Amount" : [10, 7, 4, 2, 5, 6, 2] } ) dataFrameGroupBy = dataFrame.groupby(["Animal", "FeedType"]) seriesGroupBy = dataFrameGroupBy["Amount"] series = seriesGroupBy.sum() print(series) """ Animal FeedType Animal1 A 10 B 5 Animal2 A 2 B 13 Animal3 A 6 Name: Amount, dtype: int64 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas
더 읽기
■ DataFrame 클래스의 pivot_table 메소드에서 values/index/columns/aggfunc 인자를 사용해 피벗 데이터를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
|
import pandas as pd dataFrame1 = pd.DataFrame( { "Animal" : ["Animal1", "Animal2", "Animal3", "Animal2", "Animal1", "Animal2", "Animal3"], "FeedType" : ["A", "B", "A", "A", "B", "B", "A"], "Amount" : [10, 7, 4, 2, 5, 6, 2] } ) dataFrame2 = dataFrame1.pivot_table(values = "Amount", index = "Animal", columns = "FeedType", aggfunc = "sum") print(dataFrame2) """ FeedType A B Animal Animal1 10.0 5.0 Animal2 2.0 13.0 Animal3 6.0 NaN """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install
더 읽기
■ pivot_table 함수에서 values/index/columns/aggfunc 인자를 사용해 피벗 테이블의 데이터를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101
|
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "x" : np.random.uniform(1.0, 168.0, 12), "y" : np.random.uniform(7.0, 334.0, 12), "z" : np.random.uniform(1.7, 20.7, 12), "month" : [5, 6, 7] * 4, "week" : [1, 2] * 6, } ) print(dataFrame1) print() """ x y z month week 0 51.147907 186.453553 18.048592 5 1 1 17.414609 134.206940 18.168186 6 2 2 125.479678 275.452230 4.875730 7 1 3 163.957947 230.605326 4.792094 5 2 4 82.406862 264.809601 11.619394 6 1 5 72.015022 216.739788 8.978817 7 2 6 130.329259 178.444185 16.741323 5 1 7 48.271124 92.696412 17.645448 6 2 8 76.477016 120.586115 10.668580 7 1 9 114.988345 18.068705 12.941800 5 2 10 42.186119 124.941915 20.037603 6 1 11 17.708408 331.049473 19.871238 7 2 """ dataFrame2 = pd.melt(dataFrame1, id_vars = ["month", "week"]) print(dataFrame2) """ month week variable value 0 5 1 x 51.147907 1 6 2 x 17.414609 2 7 1 x 125.479678 3 5 2 x 163.957947 4 6 1 x 82.406862 5 7 2 x 72.015022 6 5 1 x 130.329259 7 6 2 x 48.271124 8 7 1 x 76.477016 9 5 2 x 114.988345 10 6 1 x 42.186119 11 7 2 x 17.708408 12 5 1 y 186.453553 13 6 2 y 134.206940 14 7 1 y 275.452230 15 5 2 y 230.605326 16 6 1 y 264.809601 17 7 2 y 216.739788 18 5 1 y 178.444185 19 6 2 y 92.696412 20 7 1 y 120.586115 21 5 2 y 18.068705 22 6 1 y 124.941915 23 7 2 y 331.049473 24 5 1 z 18.048592 25 6 2 z 18.168186 26 7 1 z 4.875730 27 5 2 z 4.792094 28 6 1 z 11.619394 29 7 2 z 8.978817 30 5 1 z 16.741323 31 6 2 z 17.645448 32 7 1 z 10.668580 33 5 2 z 12.941800 34 6 1 z 20.037603 35 7 2 z 19.871238 """ print() dataFrame3 = pd.pivot_table( dataFrame2, values = "value", index = ["variable", "week"], columns = ["month"], aggfunc = "mean", ) print(dataFrame3) """ month 5 6 7 variable week x 1 90.738583 62.296490 100.978347 2 139.473146 32.842867 44.861715 y 1 182.448869 194.875758 198.019173 2 124.337015 113.451676 273.894630 z 1 17.394958 15.828498 7.772155 2 8.866947 17.906817 14.425027 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas
더 읽기
■ melt 함수의 id_vars 인자를 사용해 DataFrame 객체의 특정 컬럼을 기준으로 데이터를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
|
import pandas as pd dataFrame1 = pd.DataFrame( { "first" : ["John", "Mary"], "last" : ["Doe", "Bo"], "height" : [5.5, 6.0], "weight" : [130, 150] } ) print(dataFrame1) """ first last height weight 0 John Doe 5.5 130 1 Mary Bo 6.0 150 """ dataFrame2 = pd.melt(dataFrame1, id_vars = ["first", "last"]) print(dataFrame2) """ first last variable value 0 John Doe height 5.5 1 Mary Bo height 6.0 2 John Doe weight 130.0 3 Mary Bo weight 150.0 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※
더 읽기
■ DataFrame 클래스의 생성자에서 tuple 리스트 객체를 사용해 DataFrame 객체를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
|
import pandas as pd import numpy as np list1 = list(range(1, 5)) list2 = list1 + [np.nan] # [1, 2, 3, 4, nan] enumerate1 = enumerate(list2) list3 = list(enumerate1) # [(0, 1), (1, 2), (2, 3), (3, 4), (4, nan)] dataFrame = pd.DataFrame(list3) print(dataFrame) """ 0 1 0 0 1.0 1 1 2.0 2 2 3.0 3 3 4.0 4 4 NaN """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install
더 읽기
■ ndarray 클래스의 reshape 메소드를 사용해 배열을 변형하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
|
import numpy as np list1 = list(range(1, 24)) + [np.nan] ndarray1 = np.array(list1) ndarray2 = ndarray1.reshape(2, 3, 4) print(ndarray2) """ [[[ 1. 2. 3. 4.] [ 5. 6. 7. 8.] [ 9. 10. 11. 12.]] [[13. 14. 15. 16.] [17. 18. 19. 20.] [21. 22. 23. nan]]] """ |
▶ requirements.txt
※ pip install numpy 명령을 실행했다.
■ array 함수를 사용해 ndarray 객체를 만드는 방법을 보여준다. ▶ main.py
|
import numpy as np list1 = list(range(1, 24)) + [np.nan] ndarray1 = np.array(list1) print(ndarray1) """ [ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. nan] """ |
▶ requirements.txt
※ pip install numpy 명령을 실행했다.
■ DataFrame 클래스를 사용해 데이터 변형하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
|
import pandas as pd import numpy as np list1 = list(range(1, 24)) + [np.nan] """ [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, nan] """ ndarray = np.array(list1).reshape(2, 3, 4) print(ndarray) """ [[[ 1. 2. 3. 4.] [ 5. 6. 7. 8.] [ 9. 10. 11. 12.]] [[13. 14. 15. 16.] [17. 18. 19. 20.] [21. 22. 23. nan]]] """ print() dataFrame = pd.DataFrame([tuple(list(x) + [val]) for x, val in np.ndenumerate(ndarray)]) print(dataFrame) """ 0 1 2 3 0 0 0 0 1.0 1 0 0 1 2.0 2 0 0 2 3.0 3 0 0 3 4.0 4 0 1 0 5.0 5 0 1 1 6.0 6 0 1 2 7.0 7 0 1 3 8.0 8 0 2 0 9.0 9 0 2 1 10.0 10 0 2 2 11.0 11 0 2 3 12.0 12 1 0 0 13.0 13 1 0 1 14.0 14 1 0 2 15.0 15 1 0 3 16.0 16 1 1 0 17.0 17 1 1 1 18.0 18 1 1 2 19.0 19 1 1 3 20.0 20 1 2 0 21.0 21 1 2 1 22.0 22 1 2 2 23.0 23 1 2 3 Na """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을 실행했다.
■ DataFrame 클래스의 groupby 메소드를 사용해 그룹 데이터 평균/표준 편차를 계산하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
|
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "x" : np.random.uniform(1.0, 168.0, 120), "y" : np.random.uniform(7.0, 334.0, 120), "z" : np.random.uniform(1.7, 20.7, 120), "month" : [5, 6, 7, 8] * 30, "week" : np.random.randint(1, 4, 120) } ) dataFrameGroupBy = dataFrame1.groupby(["month", "week"]) seriesGroupBy = dataFrameGroupBy["x"] dataFrame2 = seriesGroupBy.agg(["mean", "std"]) print(dataFrame2) """ mean std month week 5 1 88.947039 45.873949 2 84.626773 43.200584 3 88.982771 48.427208 6 1 86.000993 45.648100 2 88.483033 44.147915 3 104.315404 35.565770 7 1 78.417683 39.055948 2 83.794869 60.363769 3 74.237160 46.610472 8 1 67.600496 48.462412 2 88.180771 50.919670 3 85.207618 52.555796 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install
더 읽기
■ DataFrame 클래스에서 + 연산자를 사용해 데이터를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
|
import pandas as pd import numpy as np dataFrame = pd.DataFrame( { "a" : np.random.randn(10), "b" : np.random.randn(10) } ) series = dataFrame["a"] + dataFrame["b"] print(series) """ 0 1.985991 1 -0.256024 2 -0.618540 3 -1.099926 4 -1.513143 5 0.790429 6 -0.872613 7 -2.209237 8 1.297783 9 -0.307506 dtype: float64 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을 실행했다.
■ DataFrame 클래스의 eval 메소드에서 문자열 수식을 평가해 데이터를 만드는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
|
import pandas as pd import numpy as np dataFrame = pd.DataFrame( { "a" : np.random.randn(10), "b" : np.random.randn(10) } ) series = dataFrame.eval("a + b") print(series) """ 0 -1.160789 1 0.185323 2 -0.452090 3 -1.014841 4 -1.662493 5 -2.349962 6 1.007531 7 0.765110 8 -0.692264 9 -0.375315 dtype: float64 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas
더 읽기
■ DataFrame 클래스의 [] 연산자에서 조건식을 사용해 데이터를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
|
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "a" : np.random.randn(10), "b" : np.random.randn(10) } ) dataFrame2 = dataFrame1[dataFrame1["a"] <= dataFrame1["b"]] print(dataFrame2) """ a b 1 -0.184688 0.273896 2 -1.441498 0.736359 3 -1.427919 0.328332 4 -1.542995 -0.781992 5 -0.940297 -0.817988 7 -1.457501 2.540671 9 0.393672 1.654631 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas 명령을
더 읽기
■ DataFrame 클래스의 query 메소드를 사용해 특정 조건을 만족하는 데이터를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
|
import pandas as pd import numpy as np dataFrame1 = pd.DataFrame( { "a" : np.random.randn(10), "b" : np.random.randn(10) } ) dataFrame2 = dataFrame1.query("a <= b") print(dataFrame2) """ a b 2 -1.763296 1.042065 3 1.598495 1.718826 5 -0.988847 -0.722642 7 -0.691313 0.419279 8 -0.207768 0.020203 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install
더 읽기
■ uniform 함수를 사용해 균일 분포에서 특정 범위의 난수 N개를 구하는 방법을 보여준다. ▶ main.py
|
import numpy as np ndarrary1 = np.random.uniform(0.200, 0.400, 25) # 0.2에서 0.4 사이에서 24개 난수를 추출한다. print(ndarrary1) |
▶ requirements.txt
※ pip install
더 읽기
■ sample 함수를 사용해 임의의 문자 리스트를 구하는 방법을 보여준다. ▶ 예제 코드 (PY)
|
import random import string stringList = random.sample(list(string.ascii_lowercase), 25) print(stringList) """ ['e', 'x', 'h', 'o', 'j', 'd', 'q', 'm', 'b', 'v', 'w', 'k', 'l', 'r', 's', 'u', 'i', 'g', 'a', 'f', 'n', 'z', 'c', 'p', 't'] """ |
■ ascii_lowercase 변수를 사용해 알파벳 소문자 문자열을 구하는 방법을 보여준다. ▶ 예제 코드 (PY)
|
import string asciiLowercaseString = string.ascii_lowercase print(asciiLowercaseString) """ abcdefghijklmnopqrstuvwxyz """ |
■ DataFrame 클래스의 pivot_table 메소드에서 values/columns/aggfunc 인자를 사용해 데이터를 집계하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
|
import pandas as pd import random import string import numpy as np dataFrame1 = pd.DataFrame( { "team" : ["team %d" % (x + 1) for x in range(5)] * 5, "player" : random.sample(list(string.ascii_lowercase), 25), "batting avg" : np.random.uniform(0.200, 0.400, 25), } ) dataFrame2 = dataFrame1.pivot_table(values = "batting avg", columns = "team", aggfunc = "max") print(dataFrame2) """ team team 1 team 2 team 3 team 4 team 5 batting avg 0.392683 0.328955 0.34881 0.359815 0.383187 """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
※ pip install pandas
더 읽기
Series 클래스의 isin 메소드를 사용해 지정 값 리스트에 포함 여부를 갖는 Series 객체를 구하는 방법을 보여준다. ▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
|
import pandas as pd import numpy as np series1 = pd.Series(np.arange(5), dtype = np.float32) series2 = series1.isin([2, 4]) print(series2) """ 0 False 1 False 2 True 3 False 4 True dtype: bool """ |
▶ requirements.txt
|
numpy==2.1.2 pandas==2.2.3 python-dateutil==2.9.0.post0 pytz==2024.2 six==1.16.0 tzdata==2024.2 |
더 읽기