본문 바로가기
Python/Basic Data Analysis

[Python] 데이터프레임 결합 (.concat, .append)

by JKyun 2017. 11. 27.

안녕하세요. 우주신 입니다.


오늘은 파이썬에서 pandas 라이브러리의 concat 함수와 append 함수를 이용하여 

데이터프레임끼리 합치는 방법을 포스팅하겠습니다.


우선, import pandas as pd 를 통해 pandas를 가져왔습니다.

데이터프레임 결합에 이용할 3개의 데이터프레임을 만들었습니다.



df1과 df2는 인덱스만 다를 뿐 값이 다 같습니다.

df3는 df1과 달리 3번째 열이 'Color_Num' 입니다.




1. pd.concat()


concat는 연결의 뜻을 가진 concatenation의 줄임말 입니다.

pandas의 concat을 이용해 df1, df2를 결합 했습니다.


pd.concat( [데이터프레임, 데이터프레임] )


밑의 출력된 결과를 보면 같은 열의 이름에 맞춰 세로로 결합된 것을 확인할 수 있습니다.


이번엔 df1과 df3를 결합해보겠습니다.


Color_Num과 Price를 서로 공유하고 있지 않기 때문에 NaN 값이 뜨는 것을 볼 수 있습니다.



2. dataframe.append()


이번엔 append() 함수를 이용하여 데이터프레임끼리 결합해보겠습니다.


데이터프레임.append(데이터프레임)


각각의 열의 이름에 맞춰 세로로 결합된 것을 볼 수 있습니다.


df1과 df3를 결합 시켜보았습니다.


위의 concat 함수를 사용하여 결합한 결과와 같습니다.


이번엔 한 행의 데이터프레임을 append()를 이용해 결합해보겠습니다.

우선, df3의 열에 맞춰 pd.Series()를 이용해 데이터프레임을 만들고,

append()를 이용해 결합하되 ignore_index = True 기능을 넣어 인덱스 이름을 무시했습니다.


마지막 행에 데이터가 추가된 것을 확인할 수 있습니다.




댓글0