Python/데이터 분석
Python Pandas 기초(2)
Yonggyu
2023. 9. 27. 17:21
반응형
Dictionaty를 DataFrame으로 변환하기 dict --> dataframe
key --> column(세로), value --> value(가로)가 된다.
DataFrame객체를 생성하면서 argument로 dictionary를 넣어주면된다. 그러면 argument에 생성자의 parameter로 전달된다.
dict1= {
'name' : ['이순신','유관순','강감찬','안중근'],
'birth' : [2011,2016,2015,2015],
'gender' : ['male','femal','male','male'],
'height' : [192,170,174,198]
}
dd=pd.DataFrame(dict1)
display(dd)
딕셔너리 dict1을 pandas의 DataFrame()을 사용하여 DataFrame으로 만들고 출력하였다.
DataFrame을 생성한 후에 column 추가하기
- 딕셔너리의 값추가하듯이 하면된다.
dd['age']= [46, 18, 72, 30]
display(dd)
DataFrame을 생성한 후에 index 지정하여 추가하기
dd=pd.DataFrame(dict1,index=['person1','person2','person3','person4'])
display(dd)
index가 person1,person2,...로 바뀌어 출력된다.
DataFrame의 describe() 메소드
- 숫자형 column들의 기초통계랑을 반환함
- 전체 data 개수/ 평균/ 4분위수 등을 제공함
import pandas as pd
import numpy as np
ti_df = pd.read_csv('titanic_train.csv') # titanic_train.csv는 exel파일
display(ti_df.describe())
결과
column(열)의 개수, 최소, 최대 등 정보들을 나열하여 보여준다.
728x90
반응형