简述区间估计的含义,下列关于区间估计的说法中

  简述区间估计的含义,下列关于区间估计的说法中

  这里的场景是:给定一组数据,估计一个区间,使区间内的数据大致均匀分布,保证区间内的数据能包含总数据的大部分。

  (在统计学中,“区间估计”是指从样本中获得的值与总体真实值之间的误差)

  一.工具

  Python:

  熊猫包:绘图和数据分析比Java有优势。

  Java:

  Range类:生成区间范围,方便判断数据是否在区间内;

  谓词类;

  表达式

  二、应用场景

  假设有一组不规则数据X[x1,x2,x3,x4,x5,x6,…],需要估计其有效区间范围[a,b],可以保证大部分数据落在范围a,b内。

  三、计算方法

  排序,从小到大;取1/4处的值,假设X;取3/4处的值,假设是Y;a=x-1.5 *(y-x);b=y 1.5 *(y-x);四。原则

  类似于盒图绘制原理,求数据的四分位数。

  如果用一组数据画直方图,选择横坐标的第一反应是用数据的最小值作为起点,用数据的最大值作为终点(刻度)。但这里有个问题:如果数据分布不均匀(标准差较大),比如100个值中最小值为1,最大值为1000,但其他所有值都小于5,那么画出来的图就不“漂亮”。最好的办法是找一个区间,这个区间可以包含大部分数据。求四分位数是一个相对简单的方法,来源于经验,但在大多数情况下是有用的。

简述区间估计的含义,下列关于区间估计的说法中