Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 카톡
- RDS
- SSA
- socket io
- MongoDB
- node
- 파이썬
- 튜플
- docker
- dict
- async
- git
- Class
- crud
- S3
- wetube
- SAA
- EC2
- pandas
- merge
- Vue
- AWS
- TypeScript
- NeXT
- react
- flask
- 중급파이썬
- 채팅
- Props
- lambda
Archives
- Today
- Total
초보 개발자
5. 데이터 확인 ( 나도 코딩 pandas ) 본문
이번엔 데이터를 확인할 수 있는 방법을 배워보자.
describe
이건 계산 가능한 컬럼들의 정보를 나타내준다. 이름과 학교 같이 스트링은 계산이 불가하기에 나오지 않는다.
개수, 평균, 표준편차 등 여러 정보를 확인할 수 있다.
info
전체 데이터의 전반적인 자료를 확인할 수 있다. 자료형, 컬럼수, 메모리 등을 확인할 수 있다.
head
head를 적으면 제일 위 5개를 보여준다.
head(7)이라고 적으면 7개를 보여준다.
tail
마찬가지로 tail을 적으면 맨 뒤의 5개의 로우는 가져오는데 7을 넣어주어 뒤의 7개를 가져왔다.
values
2차원 배열 형식으로 모든 데이터를 보여준다.
index
index를 확인할 수 있다.
columns
컬럼 명도 확인할 수 있다.
shape
해당 데이터 프레임의 행과 열의 갯수를 알 수 있다. 인덱스 부분은 제외
Series
각 컬럼은 처음에 배웠던 시리즈에 해당하기 때문에 이 역시도 위에서 배운 것들을 사용할 수 있다.
nlargest
이걸 사용하면 해당 컬럼에서 가장 큰 값을 매개변수에 적힌 수 만큼 보여준다.
sw컬럼에는 NaN값이 2개 들어있었다. 따라서 8개가아닌 6개로 출력이 되는 걸 확인할 수 있다.
unique
unique를 적으면 중복된 자료 값이 있더라도 하나만 출력을 해준다.
nunique 를 사용하면 갯수를 출력해준다
'Python > pandas' 카테고리의 다른 글
7 결측치 ( 나도코딩 pandas ) (0) | 2022.11.06 |
---|---|
6. 데이터선택 iloc, 조건 ( 나도코딩 pandas ) (0) | 2022.11.06 |
4. 파일 열고 저장하기 ( 나도코딩 pandas ) (0) | 2022.10.29 |
3. index ( 나도 코딩 pandas ) (0) | 2022.10.29 |
2. DataFrame ( 나도 코딩 pandas ) (0) | 2022.10.29 |