본문 바로가기
Python/Basic Data Analysis

[Python] 데이터프레임 만들기 (pandas 활용)

by JKyun 2017. 9. 6.


안녕하세요. 우주신 입니다. 


오랜만에 블로그 글을 남깁니다. 이것저것 바빠 활동을 잘하지 못 했네요. 


앞으로 더 많은 포스팅 하겠습니다. 오늘은 pandas를 활용하여 데이터프레임을 생성하는 방법을 보겠습니다.


데이터 분석을 한다면 R로 하는 경우가 많았는데, pandas가 등장한 뒤로 파이썬에서도 쉽게 데이터를 다룰 수 있게 되어 많은 사랑을 받고 있어요!




먼저, pandas 모듈을 가져오고, DataFrame 기능을 간단히 df로 정의했습니다.



df(data= )의 데이터 입력 자리에 딕셔너리를 활용하여 df1 데이터프레임을 만들어봤습니다.

아주 깔끔하게 데이터프레임이 생성된 것을 확인할 수 있습니다.


자, 이제 열의 순서를 바꿔보겠습니다.

단순히, columns= 옵션을 활용하여 [] 리스트 안에 원하는 열의 순서대로 열 이름을 입력하면 됩니다.


행의 이름을 지정하지 않으면 default는 0부터 순서가 입력되지만 index= 기능을 활용하여 인덱스를 지정해줍니다.


 

numpy의 arange 함수를 활용하여 0부터 5까지 2행 3열의 형태로 데이터프레임을 만들었어요.

dtype='int': 데이터 형태를 int로 지정하라

copy=False: 입력 데이터를 복사할지 지정하라

 

아주 간단하고 가장 기본적인 함수들을 살펴봤습니다.

pandas Dataframe은 그 외 수많은 기능들을 제공하니 구글링을 통해 자세히 한번 살펴보시길 바랍니다.


 




수고하셨습니다~







댓글