题目内容
【题目】某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:,试估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时.请完成每周平均体育运动时间与性别的列联表,并判断能否在犯错误的概率不超过0.05的前提下认为该校学生的每周平均体育运动时间与性别有关?
男生 | 女生 | 合计 | |
每周平均体育运动时间不超过4小时 | |||
每周平均体育运动时间超过4小时 | |||
合计 | 300 |
附:,其中.
0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
【答案】见解析
【解析】(1)由,得应收集90位女生的样本数据.(3分)
(2)由频率分布直方图得每周平均体育运动时间超过4小时的频率为,由频率估计概率得该校学生每周平均体育运动时间超过4小时的概率为0.75. (7分)
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人每周平均体育运动时间不超过4小时,又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别的列联表如下:
男生 | 女生 | 合计 | |
每周平均体育运动时间不超过4小时 | 45 | 30 | 75 |
每周平均体育运动时间超过4小时 | 165 | 60 | 225 |
合计 | 210 | 90 | 300 |
(10分)
因为的观测值,
所以能在犯错误的概率不超过0.05的前提下认为该校学生的每周平均体育运动时间与性别有关.(12分)