箱线图如何绘制,matplotlib箱形图
什么是方框图?
我们画箱线图的目的,其实就是为了检验数据分布的离散程度。
方框图的所有重要部分都标在图上了。对于箱形图,图中的元素有:
最大值Q3(数据超过75%的站点)、中位数Q1(数据超过25%的站点)和最小值Q3与Q1之间的部分称为IQR(四分位间距)。通过查看和比较不同数据的箱线图,可以知道数据是以离散程度分布的。
用Matplotlib映射导入Matplotlib . mlab as mlabimport Matplotlib . pyplotlib as pltin _ file= data 7602 decidenyiyearolder . CSV data=PD . read _ CSV(in _ file,Engine= python )EC _ 2000=data[data[ year ]==2000][ EC _ count ]EC _ 2001=data[data[ year ]==2001][ EC _ count ]_=PLT.
该代码提取数据中的两列,并绘制一个方框图。您可以看到两列的中值相似,但右列中的数据更离散。黑色方块是一个异常值。
参考
[1]http://esta . ncku . edu . tw/NSC/flash/topic/graph _ stat/base/box plot . html