초보 개발자

5. 데이터 확인 ( 나도 코딩 pandas ) 본문

Python/pandas

5. 데이터 확인 ( 나도 코딩 pandas )

taehyeki 2022. 11. 1. 22:55

이번엔 데이터를 확인할 수 있는 방법을 배워보자.

 

 

describe

이건 계산 가능한 컬럼들의 정보를 나타내준다. 이름과 학교 같이 스트링은 계산이 불가하기에 나오지 않는다.

개수, 평균, 표준편차 등 여러 정보를 확인할 수 있다.

 

info

전체 데이터의 전반적인 자료를 확인할 수 있다. 자료형, 컬럼수, 메모리 등을 확인할 수 있다.

 

head

head를 적으면 제일 위 5개를 보여준다.

head(7)이라고 적으면 7개를 보여준다.

 

tail

마찬가지로 tail을 적으면 맨 뒤의 5개의 로우는 가져오는데 7을 넣어주어 뒤의 7개를 가져왔다.

 

 

values

2차원 배열 형식으로 모든 데이터를 보여준다.

 

index

index를 확인할 수 있다.

 

columns

컬럼 명도 확인할 수 있다.

 

shape

해당 데이터 프레임의 행과 열의 갯수를 알 수 있다. 인덱스 부분은 제외

 

Series 

각 컬럼은 처음에 배웠던 시리즈에 해당하기 때문에 이 역시도 위에서 배운 것들을 사용할 수 있다.

nlargest

이걸 사용하면 해당 컬럼에서 가장 큰 값을 매개변수에 적힌 수 만큼 보여준다.

 

sw컬럼에는 NaN값이 2개 들어있었다. 따라서 8개가아닌 6개로 출력이 되는 걸 확인할 수 있다.

 

unique

unique를 적으면 중복된 자료 값이 있더라도 하나만 출력을 해준다.

 

nunique 를 사용하면 갯수를 출력해준다