Python/데이터 분석

Python Pandas 기초(2)

Yonggyu 2023. 9. 27. 17:21
반응형

 

Dictionaty를 DataFrame으로 변환하기 dict  -->  dataframe

key --> column(세로), value --> value(가로)가 된다.

DataFrame객체를 생성하면서 argument로 dictionary를 넣어주면된다. 그러면 argument에 생성자의 parameter로 전달된다.

 

dict1= {
    'name' : ['이순신','유관순','강감찬','안중근'],
    'birth' : [2011,2016,2015,2015],
    'gender' : ['male','femal','male','male'],
    'height' : [192,170,174,198]
    
}
dd=pd.DataFrame(dict1)
display(dd)

딕셔너리 dict1을 pandas의 DataFrame()을 사용하여 DataFrame으로 만들고 출력하였다.

 

DataFrame을 생성한 후에 column 추가하기
- 딕셔너리의 값추가하듯이 하면된다.

dd['age']= [46, 18, 72, 30]   
display(dd)


  

DataFrame을 생성한 후에 index 지정하여 추가하기

 

dd=pd.DataFrame(dict1,index=['person1','person2','person3','person4']) 
display(dd)

 

index가 person1,person2,...로 바뀌어 출력된다.

 

 

DataFrame의 describe() 메소드

- 숫자형 column들의 기초통계랑을 반환함
- 전체 data 개수/ 평균/ 4분위수 등을 제공함

 

import pandas as pd
import numpy as np

ti_df = pd.read_csv('titanic_train.csv')  # titanic_train.csv는 exel파일
display(ti_df.describe())

결과

column(열)의 개수, 최소, 최대 등 정보들을 나열하여 보여준다.

 

 

 

728x90
반응형