题目内容
【题目】某高校共有学生15 000人,其中男生10 500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:h)的样本数据.
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4 h的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4 h,请完成下面的2×2列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”?
男生 | 女生 | 总计 | |
每周平均体育运动时间不超过4h | |||
每周平均体育运动时间超过4h | |||
总计 |
附:
P(K2≥k0) | 0.100 | 0.050 | 0.010 | 0.005 |
k0 | 2.706 | 3.841 | 6.635 | 7.879 |
【答案】(1)90;(2)0.75;(3)见解析
【解析】
(1)利用分层抽样,即可求解收集90位女生的样本数据;
(2)根据频率分布直方图,即可求解学生每周平均体育运动事件超过4h的概率的估计值;
(3)根据题意列出的列联表,利用的计算公式,求得的值,即可作出判断.
(1)由分层抽样可得300×=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得学生每周平均体育运动时间超过4 h的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4 h的概率的估计值为0.75.
(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4 h,75人的每周平均体育运动时间不超过4 h.样本数据中有210份是关于男生的,90份是关于女生的,可得如下列联表:
男生 | 女生 | 总计 | |
每周平均体育运动时间不超过4h | 45 | 30 | 75 |
每周平均体育运动时间超过4h | 165 | 60 | 225 |
总计 | 210 | 90 | 300 |
结合列联表可得K2的观测值k=≈4.762>3.841.
所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.