题目内容
【题目】某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吗?
(3)如果已知男、女的样本量都是25,你能计算出总样本的均值和方差各为多少吗?它们分别作为总体均值和方差的估计合适吗?为什么?
【答案】(1)不能,见解析;(2)能,170.02,43.24;(3)168.67,46.89,不合适,见解析.
【解析】
(1)由于不知道如何抽取的样本,因此没法计算总体均值,同样没法计算总体方差;
(2)按男女生比例抽取样本,可按相应公式计算均值和方差;
(3)已知样本量,可按样本量所占比计算均值与方差,但不具代表性,个体不是等概率抽取的.
公式:分层抽样中两组数据的抽样比例是,则总体均值为,
总体方差
(1)不能,因为本题没有给出男、女生的样本量,或者男、女生样本量的比例,故无法计算出总样本的均值和方差..
(2)总样本的均值为.
总样本的方差.
(3)总样本的均值为.
总样本的方差为.
不能作为总体均值和方差的估计,因为分层抽样中未按比例抽样,总体中每个个体被抽到的可能性不完全相同,因而样本的代表性差.
【题目】已知某市2015年全年空气质量等级如表1所示.
表1
空气质量等级(空气质量指数(AQI)) | 频数 | 频率 |
优() | 83 | 22.8% |
良() | 121 | 33.2% |
轻度污染() | 68 | 18.6% |
中度污染() | 49 | 13.4% |
重度污染() | 30 | 8.2% |
严重污染() | 14 | 3.8% |
合计 | 365 | 100% |
2016年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60
191 62 55 58 56 53 89 90 125 124
103 81 89 44 34 53 79 81 62 116
88
6月 63 92 110 122 102 116 81 163 158 76
33 102 65 53 38 55 52 76 99 127
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市2016年6月的空气质量情况.
(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?
(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于去年?
【题目】某城市的公交公司为了方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间与乘客等候人数之间的关系,经过调查得到如下数据:
间隔时间/分 | 10 | 11 | 12 | 13 | 14 | 15 |
等候人数y/人 | 23 | 25 | 26 | 29 | 28 | 31 |
调查小组先从这组数据中选取组数据求线性回归方程,再用剩下的组数据进行检验.检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数,再求与实际等候人数的差,若差值的绝对值都不超过,则称所求方程是“恰当回归方程”.
(1)从这组数据中随机选取组数据后,求剩下的组数据的间隔时间不相邻的概率;
(2)若选取的是后面组数据,求关于的线性回归方程,并判断此方程是否是“恰当回归方程”;
(3)为了使等候的乘客不超过人,试用(2)中方程估计间隔时间最多可以设置为多少(精确到整数)分钟.
附:对于一组数据,,……,,其回归直线的斜率和截距的最小二乘估计分别为:,.