■ write.csv 함수를 사용해 CSV 파일을 쓰는 방법을 보여준다. ▶ 매출 data.frame에서 점포가 “a”인 데이터를 추출하고 “A점포.csv” 파일에 쓰기 (R)
|
매출 = read.csv("data_win.csv") A점포 = 매출 %>% filter(점포 == "a") write.csv(A점포, "A점포.csv", row.names = F) |
■ group_by 함수를 사용해 데이터 그룹을 만드는 방법을 보여준다. ▶ 매출 data.frame에서 점포가 “a”인 데이터를 추출하고 추출된 결과에서 매출월 별로 최소 구매
더 읽기
■ View 함수를 사용해 작업 결과를 RStudio 그리드에서 조회하는 방법을 보여준다. ▶ 매출 data.frame에서 매출월/성별 최소 구매 건수와 최대 구매 건수를 구하고
더 읽기
■ summarise 함수를 사용해 복수 값들을 단일 값으로 구하는 방법을 보여준다. ▶ 매출 data.frame에서 매출월이 1월인 데이터를 추축하고 추출된 결과에서 평균 구매
더 읽기
■ %in% 연산자를 사용해 벡터의 값 존재 여부를 구하는 방법을 보여준다. ▶ 매출 data.frame에서 요일이 월요일, 화요일, 수요일인 데이터 추출하기 (R)
|
subset(매출, 요일 %in% c("월", "화", "수")) |
■ %>% 연산자를 사용해 복수 작업을 함께 연결하는 방법을 보여준다. ▶ 매출 data.frame에서 매출월 1월인 데이터를 추출하고 추출된 결과에서 성별이 남자인 데이터
더 읽기
■ filter 함수를 사용해 데이터를 추출하는 방법을 보여준다. ▶ 매출 data.frame에서 매출월이 1월인 데이터 추출하기 (R)
|
매출 = read.csv("data_win.csv") filter(매출, 매출월 == 1) 매출월 요일 점포 성별 구매건수 1 1 월 a 남 21451 2 1 화 b 여 24922 3 1 수 c 남 8835 ... 208 1 금 m 여 33323 209 1 토 n 남 22226 210 1 일 o 여 1714 |
■ library 함수에서 라이브러리를 사용하는 방법을 보여준다. ▶ dplyr 패키지 사용하기 (R)
▶ ggplot2 패키지 사용하기 (R)
■ subset 함수를 사용해 데이터 추출하는 방법을 보여준다. ▶ 매출 data.frame에서 매출월이 1월인 데이터 추출하기 (R)
|
매출 = read.csv("data_win.csv") subset(매출, 매출월 == 1) |
▶ 매출 data.frame에서 요일이 월요일인
더 읽기
■ < 연산자를 사용해 보다 작은지 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
5 < 10 [1] TRUE 10 < 5 [2] FALSE |
■ <= 연산자를 사용해 보다 작거나 같은지 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
5 <= 10 [1] TRUE 10 <= 5 [1] FALSE |
■ >= 연산자를 사용해 보다 크거나 같은지 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
10 >= 5 [1] TRUE 5 >= 10 [2] FALSE |
■ > 연산자를 사용해 보다 큰지 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
10 > 5 [1] TRUE 5 > 10 [1] FALSE |
■ != 연산자를 사용해 상이 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
5 != 10 [1] TRUE 5 != 5 [1] FALSE |
■ == 연산자를 사용해 상등 여부를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
5 == 5 [1] TRUE 5 == 10 [1] FALSE |
■ 패키지를 설치하는 방법을 보여준다. 1. RStudio 프로그램의 우하단에서 Packages 탭의 Install 버튼을 클릭한다. 2. Install Packages 대화 상자에서 "Packages (separate multiple
더 읽기
■ install.packages 함수를 사용해 패키지를 설치하는 방법을 보여준다. ▶ 예제 코드 (R)
|
install.packages(c("dplyr", "ggplot2")) |
■ summary 함수를 사용해 통계값을 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") summary(매출$구매건수) Min. 1st Qu. Median Mean 3rd Qu. Max. 9 11720 24340 24550 37080 49980 ※ Min. : 최소값 ※ 1st Qu. : 1/4분위 값 ※ Median : 중간값 ※ Mean : 평균값 ※ 3rd Qu. : 3/4분위 값 ※ Max. : 최대값 |
■ sd 함수를 사용해 표준 편차를 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") sd(매출$구매건수) [1] 14569.13 |
■ var 함수를 사용해 분산을 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") var(매출$구매건수) [1] 212259426 |
■ mean 함수를 사용해 평균을 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") mean(매출$구매건수) [1] 24552.9 |
■ max 함수를 사용해 최대값을 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") max(매출$구매건수) [1] 49976 |
■ min 함수를 사용해 최소값을 구하는 방법을 보여준다. ▶ 예제 코드 (R)
|
매출 = read.csv("data_win.csv") min(매출$구매건수) [1] 9 |
■ [] 연산자를 사용해 data.frame 데이터를 조회하는 방법을 보여준다. ▶ 매출 data.frame의 1행부터 10행, 1열부터 3행 사이의 데이터 조회하기 (R)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
|
매출 = read.csv("data_win.csv") 매출[1:10, 1:3] 매출월 요일 점포 1 1 월 a 2 1 화 b 3 1 수 c 4 1 목 d 5 1 금 e 6 1 토 f 7 1 일 g 8 1 월 h 9 1 화 i 10 1 수 j |
▶
더 읽기
■ $ 연산자를 사용해 data.frame 열을 참조하는 방법을 보여준다. ▶ 매출 data.frame의 구매건수 열을 조회하기 (R)
|
매출 = read.csv("data_win.csv") 매출$구매건수 [1] 21451 24922 8835 13720 10826 43319 2471 10457 17081 18583 6833 33803 2265 32637 49704 33882 45928 23123 28571 [20] 22597 8386 3414 44846 13692 46510 27044 34966 41706 615 48015 34036 4238 48480 5802 43844 19384 45484 37483 [39] 43539 28638 45173 10102 34339 20495 47135 29043 31131 43904 4965 47399 26026 38362 24443 5040 25888 29762 10173 ... [2471] 4256 8748 45275 17825 866 49291 16769 49698 20580 32008 11601 41312 6531 20237 26062 746 25181 32059 26732 [2490] 2463 12363 47427 8644 33006 30975 25915 7289 18744 12944 1405 15405 18164 19510 39208 9428 22499 29255 42040 [2509] 2045 6038 31065 11845 14144 48751 40122 2839 40861 28420 17037 21201 |
▶ 매출 data.frame의 구매건수 열의
더 읽기