相关文章推荐
【Seaborn】sns.displot()用法

【Seaborn】sns.displot()用法

sns.distplot()集合了matplotlib的hist()于sns.kdeplot()功能,增了rugplot分布观测显示与理由scipy库fit拟合参数分布的新颖用途

#参数如下
sns.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)

直方图:先分箱,然后计算每个分箱频数的数据分布,

和条形图的区别,条形图有空隙,直方图没有,条形图一般用于类别特征,直方图一般用于数字特征(连续型)
多用于y值和数字(连续型)特征的分布画图

import matplotlib.pyplot as plt 
import numpy as np
import pandas as pd 
import seaborn as sns 
sns.set()  #切换到sns的默认运行配置
x=np.random.randn(100)
sns.distplot(x)

通过hist和kde参数调节是否显示直方图及核密度估计(默认hist,kde均为True)

fig,axes=plt.subplots(1,3)  #创建一个1行三列的图片
sns.distplot(x,ax=axes[0])
sns.distplot(x,hist=False,ax=axes[1])  #不显示直方图
sns.distplot(x,kde=False,ax=axes[2])  #不显示核密度

bins:int或list,控制直方图的划分

#bins
fig,axes=plt.subplots(1,2) 
sns.distplot(x,kde=False,bins=20,ax=axes[0]) #分成20个区间
sns.distplot(x,kde=False,bins=[x for x in range(4)],ax=axes[1]) #以0,1,2,3为分割点,形成区间[0,1],[1,2],[2,3],区间外的值不计入。

rag:控制是否生成观测数值的小细条

#rag
fig,axes=plt.subplots(1,2)
sns.distplot(x,rug=True,ax=axes[0]) #左图
sns.distplot(x,ax=axes[1]) #右图

fit:控制拟合的参数分布图形,能够直观地评估它与观察数据的对应关系(黑色线条为确定的分布)

#fit
from scipy.stats import *
sns.distplot(x,hist=False,fit=norm) #拟合标准正态分布

hist_kws, kde_kws, rug_kws, fit_kws参数接收字典类型,可以自行定义更多高级的样式

#
sns.distplot(x,kde_kws={"label":"KDE"},vertical=True,color="y")

norm_hist:若为True, 则直方图高度显示密度而非计数(含有kde图像中默认为True)

#norm_hist
fig,axes=plt.subplots(1,2)
sns.distplot(x,norm_hist=True,kde=False,ax=axes[0]) #左图
sns.distplot(x,kde=False,ax=axes[1]) #右图

全部代码

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
sns.set()  #切换到sns的默认运行配置
x=np.random.randn(100)
sns.distplot(x)
fig,axes=plt.subplots(1,3)  #创建一个1行三列的图片
sns.distplot(x,ax=axes[0])
sns.distplot(x,hist=False,ax=axes[1])  #不显示直方图
sns.distplot(x,kde=False,ax=axes[2])  #不显示核密度
#bins
fig,axes=plt.subplots(1,2)
sns.distplot(x,kde=False,bins=20,ax=axes[0]) #分成20个区间
sns.distplot(x,kde=False,bins=[x for x in range(4)],ax=axes[1]) #以0,1,2,3为分割点,形成区间[0,1],[1,2],[2,3],区间外的值不计入。
fig,axes=plt.subplots(1,2)
sns.distplot(x,rug=True,ax=axes[0]) #左图
sns.distplot(x,ax=axes[1]) #右图
from scipy.stats import *
sns.distplot(x,hist=False,fit=norm) #拟合标准正态分布
 
推荐文章