데이터 분석가 몽구리

[Pandas] 결측값을 찾는 방법 본문

Python

[Pandas] 결측값을 찾는 방법

데분몽굴 2024. 8. 17. 23:48

데이터프레임에서 결측값을 찾는 방법에 대해 알아보도록 하겠습니다.

airbnb_df = pd.read_csv('data/airbnb.csv')
airbnb_df

일단 데이터를 불러옵니다.

airbnb_df.info()

info() 메서드를 통해서 해당 데이터프레임의 대략적인 정보를 확인할 수 있습니다.

총 713개의 행이 존재하며, rating 컬럼의 13개의 결측값이 있다는 것을 확인할 수 있습니다.

airbnb_df.isna().sum()

boolean인덱싱을 통해 False값은 0으로 True값은 1로 계산하여 rating 컬럼의 13개가 있다는 것을 확인할 수 있습니다.

airbnb_df.isna().any(axis=1)

위 코드를 통해 각 행마다 결측값이 존재한다면 True값을, 존재하지 않는다면 False값이 나옵니다. 1번째 행에 결측값이 있기 때문에 True값이 나왔습니다. 해당 Series를 활용하여 결측값이 있는 행들만 추출해보도록 하겠습니다.

airbnb_df[airbnb_df.isna().any(axis=1)]

결측값이 있는 값들만 추출하였습니다. 이번 시간에는 결측값을 확인하는 방법에 대해 배웠습니다.
다음 시간에는 결측값이 있는 데이터들을 어떻게 처리해야하는지에 대해 배우도록 하겠습니다.

'Python' 카테고리의 다른 글

[5일차] 비밀번호 생성기 만들기  (1) 2023.05.30
[Numpy] ndarray의 데이터 타입  (0) 2023.04.17
[Python] TypeError: 'NoneType' object is not subscriptable  (0) 2023.01.08
함수  (0) 2022.12.21
variable & List (boostcamp)  (0) 2022.12.11