题目内容
某钢铁加工厂生产内径为24.50 mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35
25.40 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45
25.41 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38
25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37
25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43
25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40
25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36
25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35
25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33
25.40 25.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39
列出样本的频率分布表.
思路分析:本题考查样本的频率分布表的列法.注意频率分布表的列法步骤.特别注意的是组距和组数的确定.
解:编制频率分布表的方法步骤:
①求极差(也称全距,即一组数据中的最大者与最小者的差)
计算极差时,需要找出这组数据的最大者和最小者,当数据很多时,可借助如下算法(最大值):
S1:把这100个数据命名为A(1),A(2),A(3),…,A(100);
S2:设变量x=A(1);
S3:把A(i)(i=2,…,100)逐个与x比较,如果A(i)>x,则x=A(i).
运用上面的算法得出这组数据的最大值是25.56,用类似的方法可以得出最小值是25.24.它们的差是25.56-25.24=0.32,说明样本数据的变化范围是0.32 mm.
②决定组据与组数
样本数据有100个,由上面算得极差为0.32,取组据为0.03 mm,那么
组距=
.
于是应该将数据分成11组〔为方便起见,组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增加极差,如在左、右两端各增加适当范围(应尽量使两端增加的量相同)〕.
③决定分点,将数据分组
以组距为0.03将数据分组时,可以分成以下11组:[25.235,25.265)、[25.265,25.295)、…、[25.535,25.565).
分组时,通常对组内数值所在的区间取左闭右开区间,当然也可以采用其他分组方法.
④登记频数,计算频率,列出频率分布表
频率=
,如第一小组的频率为
=0.01.
频率分布表
分组 | 个数累计 | 频数 | 频率 |
25.235~25.265 | 1 | 1 | 0.01 |
25.265~25.295 | 2 | 2 | 0.02 |
25.295~25.325 | 5 | 5 | 0.05 |
25.325~25.355 | 12 | 12 | 0.12 |
25.355~25.385 | 18 | 18 | 0.18 |
25.385~25.415 | 25 | 25 | 0.25 |
25.415~25.445 | 16 | 16 | 0.16 |
25.445~25.475 | 13 | 13 | 0.13 |
25.475~25.505 | 4 | 4 | 0.04 |
25.505~25.535 | 2 | 2 | 0.02 |
25.535~25.565 | 2 | 2 | 0.02 |
合计 | 100 | 100 | 1.00 |
方法归纳
①组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.②频数分布表排除了由于抽样的误差,精确地反映了总体取值的概率分布规律(总体分布).