본문 바로가기

Dev

pandas의 DataFrame에서 drop 함수 사용법

pandas 라이브러리에서 이 drop()메서드는 DataFrame에서 행 또는 열을 삭제하는 데 사용할 수 있습니다.

이 매개변수는 DataFrame에서 행(axis=0) 또는 열(axis=1) **axis**을 삭제할지 여부를 지정하는 데 사용됩니다 .

 

 

예를 들어 df가 다음 데이터가 포함된 DataFrame이 있는 경우:

import pandas as pd
df = pd.DataFrame({'Name': ['John', 'Mike', 'Amy', 'Bob'], 'Age': [25, 30, 22, 35], 'City':['Seattle', 'NY', 'LA', 'Houston']})

 

열 '이름'을 삭제하려면 다음 코드를 사용할 수 있습니다.

df = df.drop("Name", axis=1)

 

결과 DataFrame은 다음과 같습니다.

   Age      City
0   25    Seattle
1   30         NY
2   22         LA
3   35   Houston

 

 

마찬가지로 인덱스 레이블이 0과 2인 행을 삭제하려는 경우 다음 코드를 사용할 수 있습니다.

df = df.drop([0, 2], axis=0)

 

결과 DataFrame은 다음과 같습니다.

   Age   City
1   30     NY
3   35  Houston

 

 

inplace=True 파라미터를 사용하여 원본 DataFrame에서 행이나 열을 삭제하는 데 사용할 수도 있습니다 . 기본값은inplace=False 지정된 행 또는 열이 제거된 새 DataFrame을 반환하는 것입니다.

df.drop("City", axis=1, inplace=True)

 

 

이렇게 하면 df에서 "City" 열이 삭제되고 결과 데이터 프레임은 다음과 같습니다.

   Age
1   30
3   35

 

 

데이터 프레임에서 행이나 열을 삭제하면 해당 데이터도 제거되므로 삭제 기능을 사용하기 전에 특히 빅 데이터로 작업할 때 데이터를 백업하는 것이 좋습니다.