网站首页 健康小知识 母婴教育 起名 运动知识 职场理财 情感生活 绿色生活 游戏数码 美容 特色美食 爱好

python用matplotlib绘制散点图、直方图、箱形图

栏目: 职场就业 / 发布于: / 人气:2.4W

python是目前使用最广泛的编程语言,因为目前正处于大数据时代;目前大数据中可视化技术至关重要,而python的matplotlib是最主要的可视化库,下面看看如何绘制散点图、直方图和箱形图,及修改图表属性的函数setp

操作方法

(01)加载numpy和ot。y=dard_normal((600,2))表示随机生成一个标准正态分布形状是600*2的数组,如图所示

python用matplotlib绘制散点图、直方图、箱形图
python用matplotlib绘制散点图、直方图、箱形图 第2张

(02)绘制散点图(使用plot)。re(figsize=(8,5))表示绘制图形的画板尺寸为8*5;(y[:,0],y[:,1],'ro')表示绘制散点图,且为红色圆标记;(True)表示图形添加网格;el('1st')表示给X轴加标签‘1st’;el('2nd')表示给Y轴加标签‘2nd’;e('Scatter Plot')表示给图形加标题‘Scatter Plot’;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第3张

(03)绘制散点图(使用scatter)。ter(y[:,0],y[:,1],marker='o')替代了上面的(y[:,0],y[:,1],'ro'),则绘图效果类似,其中marker='o'表示圆标记;如果再加上参数c='r',修改颜色后,完全等价于上图;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第4张
python用matplotlib绘制散点图、直方图、箱形图 第5张

(04)绘制散点图(色彩可视化)。c=int(0,10,len(y))表示随机生成一个第三维度的数据集,取值在0-10之间的整数;ter(y[:,0],y[:,1],c=c,marker='o')表示颜色数据来源于第三维度的c;rbar()表示添加彩条;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第6张

(05)两个数据集的直方图。re(figsize=(8,5))表示绘图画板尺寸为8*5;(y, bins=30, label=['1st','2nd'])表示使用y绘制直方图,数据组数有30个,标签分别使用'1st'和'2nd';(True)表示添加网格;nd(loc=0)表示最佳位置显示图例;el('Value')表示X轴标签为‘Value’;el('Frequency')表示Y轴标签为‘Frequency’;e('Histogram')表示标题为‘Histogram’;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第7张

(06)两个数据集堆叠的直方图。(y, bins=20, label=['1st','2nd'],color=['b','m'],stacked=True,rwidth=0.8)的参数stacked=True表示堆叠的直方图;rwidth=0.8表示修改条块的相对宽度为0.8,color=['b','m']表示颜色分别取蓝色、品红;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第8张

(07)两个数据集的箱形图。fig,ax=lots(figsize=(8,5))表示画板尺寸的设置为8*5;lot(y)表示用y绘制箱形图;(True)表示添加网格;(ax,xticklabels=['1st','2nd'])表示刻度值标签设置为'1st'和'2nd';el('var')表示X轴标签为'var';el('value')表示Y轴标签为'value';e('Boxplot')表示标题为'Boxplot';如图所示

python用matplotlib绘制散点图、直方图、箱形图 第9张

(08)用setp函数来修改图表属性。re(figsize=(8,5))表示画板尺寸设置;line=(y,'r')表示绘制红色的折线图;(line,linestyle='--')修改线条为虚线;如图所示

python用matplotlib绘制散点图、直方图、箱形图 第10张

特别提示

和scatter可以等效使用,注意参数的不同意义即可

hist(x, bins=None, range=None, density=None, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, normed=None, hold=None, data=None, **kwargs)参数解释:x:列表或ndarray对象;bins:数据组数;range:数据组的下界和上界;normed:规范化为整数1;weights:x轴上每个值的权重;cumulative:每个数据组包含较低组别的计数;histtype:bar、barstacked、step、stepfilled;align:left、mid、right;orientation:horizontal、vertical;rwidth:条块的相对宽度;log:对数刻度;color:每个数据集的颜色;label:标签所用的字符串(序列);stacked:堆叠多个数据集;kwargs :关键字参数

设置图表属性使用函数setp