Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 파이썬
- MODIFY
- 옵셔널태그
- 스프링부트
- SafeUpdate
- 김영한 #SOLID #객체지향
- 기록하기
- group by
- 개발공부
- COMMIT
- Numpy #TIL #넘파이 기초
- 스프링 입문
- C언어 #문자열변환 #정수형변환
- 머신러닝 #회귀 #규제
- GIT
- 커밋
- 클래스 #아이디
- 에러포스팅
- SQL
- 작업 영역
- scanf
- MVC #디자인패턴
- 그룹핑
- 컬럼수정
- 크롬브라우저
- 단축키정리
- 머신러닝 #학습내용정리
- 개발자가 되기 위해 꼭 알아야 하는 IT용어
- 공부내용정리
- 생성자 #자바 #기록남기기
Archives
- Today
- Total
데이터 분석가 몽구리
[Pandas] 결측값을 찾는 방법 본문
데이터프레임에서 결측값을 찾는 방법에 대해 알아보도록 하겠습니다.
airbnb_df = pd.read_csv('data/airbnb.csv')
airbnb_df
일단 데이터를 불러옵니다.
airbnb_df.info()
info() 메서드를 통해서 해당 데이터프레임의 대략적인 정보를 확인할 수 있습니다.
총 713개의 행이 존재하며, rating 컬럼의 13개의 결측값이 있다는 것을 확인할 수 있습니다.
airbnb_df.isna().sum()
boolean인덱싱을 통해 False값은 0으로 True값은 1로 계산하여 rating 컬럼의 13개가 있다는 것을 확인할 수 있습니다.
airbnb_df.isna().any(axis=1)
위 코드를 통해 각 행마다 결측값이 존재한다면 True값을, 존재하지 않는다면 False값이 나옵니다. 1번째 행에 결측값이 있기 때문에 True값이 나왔습니다. 해당 Series를 활용하여 결측값이 있는 행들만 추출해보도록 하겠습니다.
airbnb_df[airbnb_df.isna().any(axis=1)]
결측값이 있는 값들만 추출하였습니다. 이번 시간에는 결측값을 확인하는 방법에 대해 배웠습니다.
다음 시간에는 결측값이 있는 데이터들을 어떻게 처리해야하는지에 대해 배우도록 하겠습니다.
'Python' 카테고리의 다른 글
[5일차] 비밀번호 생성기 만들기 (1) | 2023.05.30 |
---|---|
[Numpy] ndarray의 데이터 타입 (0) | 2023.04.17 |
[Python] TypeError: 'NoneType' object is not subscriptable (0) | 2023.01.08 |
함수 (0) | 2022.12.21 |
variable & List (boostcamp) (0) | 2022.12.11 |