赵走x博客
网站访问量:151486
首页
书籍
软件
工具
古诗词
搜索
登录
34、延伸阅读:箱体;箱须、 离群值的含义和计算方法
33、箱线图
32、饼图
30、堆积析线图、 间断条形图和阶梯图
29、参数探索:设置柱体的填充样式
28、绘制统计图形:分块图
27、绘制统计图形:堆积图
26、绘制统计图形:条形图
25、绘制统计图形:柱状图
24、函数errorbar():用于绘制误差棒图
23、函数boxplot():用于绘制箱线图
22、函数stem():用于绘制棉棒图
21、函数 scatter():用于绘制气泡图
20、函数polar():用于绘制极线图
19、函数pie():用于绘制饼图
18、函数hist():用于绘制直方图
17、函数barh():用于绘制条形图
16、函数bar():用于绘制柱状图
15、使用统计函数绘制简单图形
14、函数组合应用
13、函数legend()一一标示不同图形的文本标签图例
12、函数title():添加图形内容的标题
11、函数text()一一添加图形内容细节的无指向型注释文本
10、函数annotate()一一添加图形内容细节的指向型注释文本
9、 函数axvspan()一一绘制垂直于 x 轴的参考区域
8、函数axhline()一一绘制平行于 x 轴的水平参考线
7、函数 grid():绘制刻度线
6、函数xlabel():设置 x 轴的标签文本
5、函数xlim():设置 x 轴的数值显示范围
4、函数scatter():寻找变量之间的关系
3、函数plot():展现变量的趋势变化
2、使用函数绘制matplotlib的图表组成元素
1、图表欣赏
34、延伸阅读:箱体;箱须、 离群值的含义和计算方法
资源编号:76092
人工智能
Python数据可视化之matplotlib实践
热度:114
箱体
关于箱体的组成部分有 : 箱体、 箱须和离群值, 其中, 箱体主要由第一四分位数、 中位数和第三四分位数 组成, 箱须又分为上箱须和下箱须。 下面, 介绍一 下这些组成部分的含义和计算方法。上箱须和下箱须长度的确定方法是在绘制箱线图的原始数据集Data中分别寻找不大于 $$Q_{3}+whis*IQR $$ 的最大值 $$ value_{max} $$ 和不小于$$Q_1-whis*IQR$$的最小值 $$value_{max}$$ 其中$$Q_1$$ 和$$Q_3$$分别是第一四分位和第三四分位数’,whis是关键字参数whis的参数值, IQR ( IQR是Inter-Quartile Range的缩写)是四分位差, 计算方法是 $$IQR=Q_3-Q1$$,。 离群值Outlier 的判断标准是$$value<(Q_1-whis*IQR)$$或者$$value>(Q_3-whis*IQR)$$,其中,value是数据集Data中的数据点。下面,为了清楚地掌握箱线图的结构组成,就用一幅如图3.22所示的示意图来阐述箱线图的各个组成元素。  由于本书主要讲授Python数据可视化的实践方法,故接下来就讨论有关Python中的四分位数的位置和数值的计算方法。 我们以图3.22的数据集为例, 讲解在Python中计算四分位数的操作方法。 下面,我们就以具体的代码进行演示,实现代码如下所示: ``` import numpy as np data=[10,1,25,11,24,13,54,4,42,-3] pc=np.array(data) x=np.percentile(pc,np.arange(0,100,25)) print(x) ``` 上述代码的运行结果如下所示: ``` [-3. 5.5 12. 24.75] ``` 其中, 第一四分位数是5.5, 中位数是12,第三四分位数是24.75。 根据数据集da钮,计算箱线图中组成结构的关键元素,计算结果如下所示 ``` Ql = 5.5 Q3 = 24.75 median = 12 IQR=Q3-Q1=19.25 Ql-1.5*IQR= -23.375 Q3+1.5*IQR = 53.625 Outlier = 54 ``` 在Python中,确定四分位数位置的方法是W=1+( n-1)×QS,其中QS可以取0.25、0.5 和 0.75。 四分位数值的计算方法是W的整数部分对应位置的数值+W的小数部分X (W的整数部分对应位置的右侧紧邻位置的数值-W的整数部分对应位置的数值)。 下面分别讲解箱线图水平放置、不显示离群值的操作方法。 关于其他关键字参数showmeans、 mean line、showb9x 和 showiaps的使用与这两种情形的操作方法类似。 这些关键字参数都属于布尔型变量, 即只有True 和 False两种取值情况。 关于它们箱线图的可视化效果, 这里就不举例进行详细说明了。