본문 바로가기
R

[R] 데이터프레임(DataFrame) 변수명 변경, 변수 선택 및 정렬

by JKyun 2017. 2. 7.



안녕하세요. 우주신입니다.


이전 포스팅에 이어 오늘은 데이터프레임 변수명 변경, 변수 선택 및 정렬에 대해 정리해보겠습니다.



우선, 매장 번호, 수입, 방문자수, 매니저로 구성된 데이터프레임을 하나 만들어보겠습니다.


1. 데이터프레임 변수명 변경


변수명 변경에는 두 가지 방법이 있습니다. 첫번째는 names( ) 함수를 사용해서 변경.

names(dataframe) <- c(new variable names)

변수가 4개이므로 이에 맞춰 V1, V2, V3, V4라는 이름으로 바꾼 결과 입니다.


두번째 방법은 rename( ) 함수에 대해 알아보겠습니다. 

rename( ) 함수를 사용하기 위해선 reshape 패키지를 설치해야 합니다.

패키지 설치에 대해선 아직 배우지 않았지만,

install.packages("패키지"), library(패키지) -> 이 두 명령어만 입력하면 패키지 안의 함수들을 사용할 수 있습니다.


V1, V2, V3, V4 변수명이 다시 바뀐 것을 확인할 수 있죠?



2. 데이터프레임 변수 선택


데이터프레임을 사용하다보면 특정 변수를 선별해야 하는 경우가 많습니다.

먼저, index[which( )] 함수에 대해 알아보겠습니다.

dataframe[which(조건, 변수선택)] 형식입니다. 

위에서는 '매장수입이 400이 넘는 번호, 수입, 방문자수, 매니저 변수를 나타내라'로 해석할 수 있습니다.


이번에는 subset( ) 함수 입니다.

subset(dataframe, select = 변수선택, subset = 조건) 형식입니다. 

'방문자수가 40이 넘는 번호, 방문자수 변수를 나타내라'로 해석할 수 있습니다.



3. 데이터프레임 정렬


데이터프레임의 특정 변수를 기준으로 정렬하는 두 가지 방법을 알아보겠습니다.


먼저, order( ) 함수를 통해 매장수입 기준으로 정렬해보겠습니다.

order(store.rev)를 보면 순위가 매겨져있는데, 약간 헷갈릴 수 있는데 이를 해석해보면,

5번째 수가 첫번째 자리로, 3번째 수가 두번째 자리로, 1번째 수가 세번째 자리로.... 이런식으로 정렬하면 오름차순이 된다는 뜻입니다.

절대값으로 표현할 땐 store.rev[order(store.rev)] 인덱스를 이용하여 그 안에 order( )함수를 넣어주면 됩니다.

전체를 나타내기 위해선 dataframe[order( ), ] 형식으로 입력하면 됩니다. ,(콤마) 잊지마세요~


두번째는 arrange( ) 함수입니다.

arrange( ) 함수는 plyr 패키지 안에 들어있습니다.

arrange(dataframe, 기준변수) 형식으로 입력하면 됩니다.

위에서 나온 결과와 똑같이 매장수입 기준으로 정렬된 것을 볼 수 있습니다. 


역순으로 정렬할 땐 desc( ) 함수를 사용하면 됩니다.






끝.


수고하셨습니다.



댓글