안녕하세요. 우주신입니다.
이전 포스팅에 이어 오늘은 데이터프레임 변수명 변경, 변수 선택 및 정렬에 대해 정리해보겠습니다.
우선, 매장 번호, 수입, 방문자수, 매니저로 구성된 데이터프레임을 하나 만들어보겠습니다.
1. 데이터프레임 변수명 변경
변수명 변경에는 두 가지 방법이 있습니다. 첫번째는 names( ) 함수를 사용해서 변경.
names(dataframe) <- c(new variable names)
변수가 4개이므로 이에 맞춰 V1, V2, V3, V4라는 이름으로 바꾼 결과 입니다.
두번째 방법은 rename( ) 함수에 대해 알아보겠습니다.
rename( ) 함수를 사용하기 위해선 reshape 패키지를 설치해야 합니다.
패키지 설치에 대해선 아직 배우지 않았지만,
install.packages("패키지"), library(패키지) -> 이 두 명령어만 입력하면 패키지 안의 함수들을 사용할 수 있습니다.
V1, V2, V3, V4 변수명이 다시 바뀐 것을 확인할 수 있죠?
2. 데이터프레임 변수 선택
데이터프레임을 사용하다보면 특정 변수를 선별해야 하는 경우가 많습니다.
먼저, index[which( )] 함수에 대해 알아보겠습니다.
dataframe[which(조건, 변수선택)] 형식입니다.
위에서는 '매장수입이 400이 넘는 번호, 수입, 방문자수, 매니저 변수를 나타내라'로 해석할 수 있습니다.
이번에는 subset( ) 함수 입니다.
subset(dataframe, select = 변수선택, subset = 조건) 형식입니다.
'방문자수가 40이 넘는 번호, 방문자수 변수를 나타내라'로 해석할 수 있습니다.
3. 데이터프레임 정렬
데이터프레임의 특정 변수를 기준으로 정렬하는 두 가지 방법을 알아보겠습니다.
먼저, order( ) 함수를 통해 매장수입 기준으로 정렬해보겠습니다.
order(store.rev)를 보면 순위가 매겨져있는데, 약간 헷갈릴 수 있는데 이를 해석해보면,
5번째 수가 첫번째 자리로, 3번째 수가 두번째 자리로, 1번째 수가 세번째 자리로.... 이런식으로 정렬하면 오름차순이 된다는 뜻입니다.
절대값으로 표현할 땐 store.rev[order(store.rev)] 인덱스를 이용하여 그 안에 order( )함수를 넣어주면 됩니다.
전체를 나타내기 위해선 dataframe[order( ), ] 형식으로 입력하면 됩니다. ,(콤마) 잊지마세요~
두번째는 arrange( ) 함수입니다.
arrange( ) 함수는 plyr 패키지 안에 들어있습니다.
arrange(dataframe, 기준변수) 형식으로 입력하면 됩니다.
위에서 나온 결과와 똑같이 매장수입 기준으로 정렬된 것을 볼 수 있습니다.
역순으로 정렬할 땐 desc( ) 함수를 사용하면 됩니다.
끝.
수고하셨습니다.
'R' 카테고리의 다른 글
[R] 기술통계(Descriptive Statistics) 함수 (0) | 2017.02.11 |
---|---|
[R] 엑셀 데이터 불러오기, 저장하기 (CSV파일) (0) | 2017.02.11 |
[R] 데이터프레임(DataFrame) 생성, 변수 추가, 결합 및 인덱싱 (4) | 2017.02.07 |
[R] 행렬(Matrix) 기본함수 및 인덱싱 (0) | 2017.02.01 |
[R] 벡터(Vector) 기본함수 및 인덱싱 (0) | 2017.01.27 |
댓글