본문 바로가기
Python 파이썬/seaborn

seaborn ) 단변수 데이터의 분포 그래프

by 하이방가루 2022. 3. 30.
728x90
반응형

커널 밀도 함수

  주어진 데이터를 정규화시켜 넓이가 1이 되도록 그린 그래프

  그래프와 x축 사이의 면적이 1이 되도록 그리는 밀도 분포 함수이다.

import matplotlib.pyplot as plt
import seaborn as sns

titanic = sns.load_dataset('titanic')

sns.kdeplot(x='fare',data=titanic)

plt.show()

 

히스토그램

  도수분포표를 그래프로 나타낸 것

  가로축이 계급, 세로축이 도수를 뜻한다.

import matplotlib.pyplot as plt
import seaborn as sns

titanic = sns.load_dataset('titanic')

sns.histplot(x='fare',data=titanic)

plt.show()

  y축에 컬럼명을 넣으면 가로축과 세로축이 바뀐다.

  kde=True 옵션을 주어 커널 밀도 그래프를 같이 표시할 수 있다.

import matplotlib.pyplot as plt
import seaborn as sns

titanic = sns.load_dataset('titanic')

sns.histplot(y='fare',kde=True,data=titanic)

plt.show()

distplot()으로도 히스토그램과 커널밀도그래프를 같이 그려 줄 수 있지만

이후 버전에서 없어질 것이라 하니 위의 두 함수를 사용할 것을 권장한다.

import matplotlib.pyplot as plt
import seaborn as sns

titanic = sns.load_dataset('titanic')

# 유의사항 : distplot은 변수입력방식이 조금 다르다
sns.distplot(titanic['fare'])

plt.show()

728x90
반응형

댓글