Python/Basic Data Analysis
[Python] 데이터프레임 만들기 (pandas 활용)
JKyun
2017. 9. 6. 05:45
안녕하세요. 우주신 입니다.
오랜만에 블로그 글을 남깁니다. 이것저것 바빠 활동을 잘하지 못 했네요.
앞으로 더 많은 포스팅 하겠습니다. 오늘은 pandas를 활용하여 데이터프레임을 생성하는 방법을 보겠습니다.
데이터 분석을 한다면 R로 하는 경우가 많았는데, pandas가 등장한 뒤로 파이썬에서도 쉽게 데이터를 다룰 수 있게 되어 많은 사랑을 받고 있어요!
먼저, pandas 모듈을 가져오고, DataFrame 기능을 간단히 df로 정의했습니다.
df(data= )의 데이터 입력 자리에 딕셔너리를 활용하여 df1 데이터프레임을 만들어봤습니다.
아주 깔끔하게 데이터프레임이 생성된 것을 확인할 수 있습니다.
자, 이제 열의 순서를 바꿔보겠습니다.
단순히, columns= 옵션을 활용하여 [] 리스트 안에 원하는 열의 순서대로 열 이름을 입력하면 됩니다.
행의 이름을 지정하지 않으면 default는 0부터 순서가 입력되지만 index= 기능을 활용하여 인덱스를 지정해줍니다.
numpy의 arange 함수를 활용하여 0부터 5까지 2행 3열의 형태로 데이터프레임을 만들었어요.
dtype='int': 데이터 형태를 int로 지정하라
copy=False: 입력 데이터를 복사할지 지정하라
아주 간단하고 가장 기본적인 함수들을 살펴봤습니다.
pandas Dataframe은 그 외 수많은 기능들을 제공하니 구글링을 통해 자세히 한번 살펴보시길 바랍니다.
수고하셨습니다~
끝