초보 개발자

2. DataFrame ( 나도 코딩 pandas ) 본문

Python/pandas

2. DataFrame ( 나도 코딩 pandas )

taehyeki 2022. 10. 29. 12:57

DataFrame 은 2차원데이터이고, 시리즈의 모음이다!

Data는 dictionary형태로 준비해야한다.

강의에서 제공하는 슬램덩크 자료를 준비해보았다.

 

data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, 95, 45, 90], '과학' : [95, 55, 80, 75, 35, 85, 40, 95], '사회' : [85, 25, 75, 80, 10, 80, 35, 95], 'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#'] }

 

dataFrame을 사용하면 위 처럼 2차원의 표가 생성이 된다. 

 

 

여기서 원하는 컬럼값을 입력하면 1차원 데이터를 리턴해준다

배열 안에 두개의 값을 넣으면 데이터 프레임을 반환해준다.

 

한글, 영어 키보드 변환하는게 귀찮아서 대충 키 값을 바꿔주었다.

 

시리즈를 만들었을 때 처럼 데이터 프레임 또한 인덱스를 지정해 줄 수 있다.

여기서 주의해야할 점은 인덱스의 갯수를 총 row의 갯수와 일치시켜주어야한다. 덜 적거나 혹은 더 적는다면 에러가 발생한다.

 

또한 위에서 가져온 data중에서 모든 컬럼을 사용하지 않고 원하는 컬럼만을 사용할 수도 있다.

기본적인 데이터 프레임 조작법을 알아보았다.