본문 바로가기
Python 파이썬/pandas

pandas ) 판다스 내장 그래프 도구

by 하이방가루 2022. 3. 22.
728x90
반응형

시리즈 or 데이터프레임 .plot(kind='그래프 종류')

line (default;기본값)

  선 그래프

  기본값이므로 데이터프레임(시지르).plot() 만으로 사용가능하다.

  가로(x)축은 인덱스를 나타내고 세로(y)축은 값을 나타낸다.

  선 하나가 시리즈(열) 1개를 나타낸다.

 

bar

  수직 막대 그래프

  가로(x)축은 인덱스를 나타내고 세로(y)축은 값을 나타낸다.

  시리즈(열) 갯수만큼의 막대가 가로 눈금마다 나타난다.

 

barh

  수평 막대 그래프

  가로(x)축은 값을 나타내고 세로(y)축은 인덱스를 나타낸다.

  시리즈(열) 갯수만큼의 막대가 세로 눈금마다 나타난다.

 

hist

  히스토그램

  값의 출현빈도수를 나타내는 도수분표 그래프

  가로(x)축은 값를 나타내고 세로(y)축은 빈도수(Frequency)을 나타낸다.

 

kde

  커널 밀도 그래프

  히스토그램과 유사하게 밀도를 보여주는 그래프

  히스토그램과 유사한 모양새를 갖추고 있다.

  부드러운 라인을 가지고 있다.

  가로(x)축은 값를 나타내고 세로(y)축은 밀도(Density)을 나타낸다.

 

box

  박스 플롯

  데이터 분포와 분산 정도에 대한 정보(최소값,1분위값,중앙값,3분위값,최대값)를 제공한다.

  사분위수 ( IQR ; inter-quartile range )

  또한 'o' 표시의 이상값도 확인할 수 있다.

  가로(x)축은 열(시리즈)를 나타내고 세로(y)축은 값을 나타낸다.

 

area

  면적 그래프 / 누적 선 그래프

  선 그래프와 x축 사이에 공간에 색이 입혀진다.

  stacked= bool - default : True 그래프를 누적할지 여부를 설정할 수 있다. 기본값은 누적시킨다.

  누적시켜 그래프를 보면 한 인덱스의 열들의 합계를 한 번에 볼 수 있다.

  alpha= 0~1(실수) 투명도(%)를 설정한다. 기본값 : 0.5

 

시리즈.pie

  파이 그래프

  원을 파이 조각처럼 나누어서 표현한다.

  조각은 인덱스를 나타내고, 조각의 크기는 해당 변수에 속하는 데이터의 값의 크기에 비례한다.

  autopct = '%.1f%%' : 퍼센트 % 표시

  colors=['색1', '색2', ...] 를 통해서 조각의 색을 지정해 줄 수 있다.

 

scatter (데이터프레임에서만 가능)

  산점도 그래프

  두 열의 관계를 나타내는 산점도를 그린다.

  x='열이름1', y='열이름2' 옵션을 추가로  넣어주어야 한다.

 

hexbin

  고밀도 산점도 그래프

  x='열이름1', y='열이름2' 옵션을 추가로  넣어주어야 한다.

  데이터의 밀도를 추정한다.

 

공통옵션

  figsize=(가로, 세로)

    그림의 가로세로 크기(inch)를 정한다.

 

pd.plotting.scatter_matrix( 데이터프레임 [,figsize=(가로,세로)] )

  데이터프레임 모든 열의 상관관계를 2차원 배열형태로 산점도그래프를 내보낸다.

728x90
반응형

댓글