题目内容
【题目】对某地区儿童的身高与体重的一组数据,我们用两种模型①,②拟合,得到回归方程分别为, ,作残差分析,如表:
身高 | 60 | 70 | 80 | 90 | 100 | 110 |
体重 | 6 | 8 | 10 | 14 | 15 | 18 |
0.41 | 0.01 | 1.21 | -0.19 | 0.41 | ||
-0.36 | 0.07 | 0.12 | 1.69 | -0.34 | -1.12 |
(Ⅰ)求表中空格内的值;
(Ⅱ)根据残差比较模型①,②的拟合效果,决定选择哪个模型;
(Ⅲ)残差大于的样本点被认为是异常数据,应剔除,剔除后对(Ⅱ)所选择的模型重新建立回归方程.
(结果保留到小数点后两位)
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为, .
【答案】(Ⅰ);(Ⅱ)模型①的拟合效果比较好;(Ⅲ) .
【解析】试题分析:(Ⅰ)将代入相应回归方程,再做差即可;(Ⅱ)比较模型①残差的绝对值与模型②残差的绝对值和即可的结论;(Ⅲ)直接根据公式求出的值,将样本的中心点代入方程可得的值,进而得结果.
试题解析:(Ⅰ)根据残差分析,把代入得.
.所以表中空格内的值为.
(Ⅱ)模型①残差的绝对值和为,
模型②残差的绝对值和为.
,所以模型①的拟合效果比较好,选择模型①.
(Ⅲ)残差大于的样本点被剔除后,剩余的数据如表
由公式: , .得回归方程为.
【题目】随着人口老龄化的到来,我国的劳动力人口在不断减少,“延迟退休”已经成为人们越来越关注的话题,为了解公众对“延迟退休”的态度,某校课外研究性学习小组在某社区随机抽取了50人进行调查,将调查情况进行整理后制成下表:
年龄 | [20,25) | [25,30) | [30,35) | [35,40) | [40,45) |
人数 | 4 | 5 | 8 | 5 | 3 |
年龄 | [45,50) | [50,55) | [55,60) | [60,65) | [65,70) |
人数 | 6 | 7 | 3 | 5 | 4 |
经调查年龄在[25,30),[55,60)的被调查者中赞成“延迟退休”的人数分别是3人和2人.现从这两组的被调查者中各随机选取2人,进行跟踪调查.
(I)求年龄在[25,30)的被调查者中选取的2人都赞成“延迟退休”的概率;
(II)若选中的4人中,不赞成“延迟退休”的人数为,求随机变量的分布列和数学期望.