题目内容
【题目】为研究女高中生身高与体重之间的关系,一调查机构从某中学中随机选取8名女高中生,其身高和体重数据如下表所示:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高 | 164 | 160 | 158 | 172 | 162 | 164 | 174 | 166 |
体重 | 60 | 46 | 43 | 48 | 48 | 50 | 61 | 52 |
该调查机构绘制出该组数据的散点图后分析发现,女高中生的身高与体重之间有较强的线性相关关系.
(1)调查员甲计算得出该组数据的线性回归方程为,请你据此预报一名身高为的女高中生的体重;
(2)调查员乙仔细观察散点图发现,这8名同学中,编号为1和4的两名同学对应的点与其他同学对应的点偏差太大,于是提出这样的数据应剔除,请你按照这名调查人员的想法重新计算线性回归话中,并据此预报一名身高为的女高中生的体重;
(3)请你分析一下,甲和乙谁的模型得到的预测值更可靠?说明理由.
附:对于一组数据,其回归方程的斜率和截距的最小二乘法估计分别为:.
【答案】(1)一名身高为的女大学生的体重约为(2)回归方程为,一名身高为的女大学生的体重约为(3)乙的模型得到的预测值更可靠,详见解析
【解析】
(1)计算平均数,求出,即可求出回归方程;把178代入即可求出的女大学生的体重;
(2)根据余下的数据计算平均数,求出,,即可求出回归方程;代入公式,即可求出身高为的女大学生的体重;
(3)从散点图以及计算数据两个方面来分析甲和乙谁的方程可靠.
解:(1)经计算:,
于是:,
则该组数据的线性回归方程为,
当时,,
于是:一名身高为的女大学生的体重约为;
(2)按照调查人员乙的想法,剩下的数据如下表所示:
编号 | 2 | 3 | 5 | 6 | 7 | 8 |
身高 | 160 | 158 | 162 | 164 | 174 | 166 |
体重 | 46 | 43 | 48 | 50 | 61 | 52 |
经计算:,
于是:
,
则该组数据的线性回归方程为,
当时,,
于是:一名身高为的女大学生的体重约为;
(3)乙的模型得到的预测值更可靠,
理由如下:①从散点图可以看出,第一组数据和第四组数据确实偏差较大,为更准确的刻画变化趋势,有必要把这两个数据剔除掉;
②从计算结果来看,相对于第七组数据的女大学生体重,甲对身高的女大学生的预测值明显偏低,而利用乙的回归方程得到的预测值增幅较合理.
(以上给出了两种理由,考生答出其中任意一种或其他合理理由均可得分)