본문 바로가기

Python Library/Pandas

5. DataFrame 병합하기

merge()를 이용한 병합

merge 명령은 두 데이터 프레임의 공통 열 혹은 인덱스를 기준으로 두 개의 테이블을 합친다. 이 때 기준이 되는 열, 행의 데이터를 키(key)라고 한다.

 

우선, 다음과 같은 DataFrame이 있다고 하자.

다음과 같이 on 파라미터에는 기준이 되는 열을, how 파라미터에는 방식을 넣으면 병합시킬 수 있다.

이 때, how 파라미터에 들어가는 inner 방식은 양쪽에 키가 모두 존재해야만 병합시켜주는 방식이다.(default 값은 inner방식임)

반대로 outer 방식은 한쪽에 키가 존재해도 병합시켜주는 방식이다.

how 파라미터에는 outer방식과 inner방식 외에도 left방식과 right방식이 올 수 있다.

left는 왼쪽 데이터 프레임의 키 값을 모두 반환해주는 방식이고

right는 오른쪽 데이터 프레임의 키 값을 모두 반환해주는 방식이다.

 

concat()을 이용한 병합

concat 명령을 사용하면 기준 열(key column)을 사용하지 않고 단순히 데이터를 연결(concatenate)한다.

기본적으로는 위/아래로 데이터 행을 연결한다. 단순히 두 시리즈나 데이터프레임을 연결하기 때문에 인덱스 값이 중복될 수 있다.

 

join()을 이용한 병합

join 명령을 이용하면 index를 통일하면서 병합할 수 있다.

 

 

<참고>

https://datascienceschool.net/view-notebook/7002e92653434bc88c8c026c3449d27b/

 

Data Science School

Data Science School is an open space!

datascienceschool.net

<소스코드>

https://github.com/Se-Hun/MachineLearningStudy/blob/master/Python%20for%20Data%20Science%20and%20Machine%20Learning%20Bootcamp/03-Python-for-Data-Analysis-Pandas/code/06-Merging%2C%20Joining%2C%20and%20Concatenating.ipynb

 

Se-Hun/MachineLearningStudy

MachineLearning에 대한 공부와 프로젝트들 정리. Contribute to Se-Hun/MachineLearningStudy development by creating an account on GitHub.

github.com

 

'Python Library > Pandas' 카테고리의 다른 글

7. 데이터 입출력  (0) 2019.08.12
6. DataFrame Buil-in 함수 및 속성들  (0) 2019.08.12
4. Groupby  (0) 2019.08.12
3. Pandas를 이용하여 NaN값 전처리하기  (0) 2019.08.12
2. DataFrame  (0) 2019.08.12