merge()를 이용한 병합
merge 명령은 두 데이터 프레임의 공통 열 혹은 인덱스를 기준으로 두 개의 테이블을 합친다. 이 때 기준이 되는 열, 행의 데이터를 키(key)라고 한다.
우선, 다음과 같은 DataFrame이 있다고 하자.
다음과 같이 on 파라미터에는 기준이 되는 열을, how 파라미터에는 방식을 넣으면 병합시킬 수 있다.
이 때, how 파라미터에 들어가는 inner 방식은 양쪽에 키가 모두 존재해야만 병합시켜주는 방식이다.(default 값은 inner방식임)
반대로 outer 방식은 한쪽에 키가 존재해도 병합시켜주는 방식이다.
how 파라미터에는 outer방식과 inner방식 외에도 left방식과 right방식이 올 수 있다.
left는 왼쪽 데이터 프레임의 키 값을 모두 반환해주는 방식이고
right는 오른쪽 데이터 프레임의 키 값을 모두 반환해주는 방식이다.
concat()을 이용한 병합
concat 명령을 사용하면 기준 열(key column)을 사용하지 않고 단순히 데이터를 연결(concatenate)한다.
기본적으로는 위/아래로 데이터 행을 연결한다. 단순히 두 시리즈나 데이터프레임을 연결하기 때문에 인덱스 값이 중복될 수 있다.
join()을 이용한 병합
join 명령을 이용하면 index를 통일하면서 병합할 수 있다.
<참고>
https://datascienceschool.net/view-notebook/7002e92653434bc88c8c026c3449d27b/
Data Science School
Data Science School is an open space!
datascienceschool.net
<소스코드>
Se-Hun/MachineLearningStudy
MachineLearning에 대한 공부와 프로젝트들 정리. Contribute to Se-Hun/MachineLearningStudy development by creating an account on GitHub.
github.com
'Python Library > Pandas' 카테고리의 다른 글
7. 데이터 입출력 (0) | 2019.08.12 |
---|---|
6. DataFrame Buil-in 함수 및 속성들 (0) | 2019.08.12 |
4. Groupby (0) | 2019.08.12 |
3. Pandas를 이용하여 NaN값 전처리하기 (0) | 2019.08.12 |
2. DataFrame (0) | 2019.08.12 |