초보 개발자

8. 데이터 정렬 및 수정 ( 나도코딩 pandas ) 본문

Python/pandas

8. 데이터 정렬 및 수정 ( 나도코딩 pandas )

taehyeki 2022. 11. 7. 21:27

데이터를 정렬해보자

sort_values

키를 통해 오름차순 정렬을 시켰다. 여기서 내림차순을 시키고 싶다면 아래의 옵션을 주면된다.

ascending=False

수학과 영어 두개를 사용하여 정렬하고 싶다면

배열안에 넣어주면된다.

정렬도 마찬가지로 배열안에 넣어주면 된다.

수학을 기준으로 오름차순하고, 같은 점수가 있다면 내림차순한다.

 

데이터 수정

만약 학교 이름이 바뀌어서 북산고에서 산북고로 되었다면

 

replace

replace를 사용하고 obj안에 기존 값을 키 쪽에, 바꿀 값은 밸류 쪽에 넣어주면 잘 바뀌는 것을 확인할 수 있다.

 

또 열 값을 전부 소문자로 바꿔주고 싶은 경우 이렇게 할 수도 있다.

또 신기한게..

~고 로 끝나는데 ~고등학교로 끝나게 하기 위해서 단순히

아래와 같이 해주면 된다.

모든 값에 등학교가 붙게 된다.

 

또한 각 열 값을 더하여 새로운 열 값을 만들 수도 있다.

이 총합을 사용하여 fail pass칸을 만들어 보자 먼저 re라는 열값을 생성하고 거기에 초기값으로 fail을 넣어보자

 

이 후 평균값을 구하고 그걸 loc를 이용해서 값을 넣어주었다.

 

column 삭제

drop

drop을 사용한 뒤 옵션으로 columns를 주고 배열안에 지우고 싶은 컬럼명을 넣으면 지워지게 된다.

 

반대로 row를 지우고 싶다면 옵션에 colunms대신에 index를 넣어주면 된다.

조건에 따라서 여러 행을 지워보자

so점수가 50점 미만인 학생들을 지워보자 필터를 만들어서 그 인덱스를 뽑아서 index옵션에 넣어주면 된다.

row 추가

loc를 이용해서 열을 하나 추가할 수 있고 갯수만큼 배열에 담아주자 아니면 에러난다.

 

특정 셀만 바꿔주고 싶다면

 

여러개를 바꾸고 싶다면 배열로 해주자