题目内容
【题目】下表中的数据是一次阶段性考试某班的数学、物理原始成绩:
用这44人的两科成绩制作如下散点图:
学号为22号的同学由于严重感冒导致物理考试发挥失常,学号为31号的同学因故未能参加物理学科的考试,为了使分析结果更客观准确,老师将两同学的成绩(对应于图中两点)剔除后,用剩下的42个同学的数据作分析,计算得到下列统计指标:
数学学科平均分为110.5,标准差为18.36,物理学科的平均分为74,标准差为11.18,数学成绩
与物理成绩的相关系数为,回归直线(如图所示)的方程为.
(1)若不剔除两同学的数据,用全部44人的成绩作回归分析,设数学成绩与物理成绩的相关系数为,回归直线为,试分析与的大小关系,并在图中画出回归直线的大致位置;
(2)如果同学参加了这次物理考试,估计同学的物理分数(精确到个位);
(3)就这次考试而言,学号为16号的同学数学与物理哪个学科成绩要好一些?(通常为了比较某个学生不同学科的成绩水平,可按公式统一化成标准分再进行比较,其中为学科原始分,为学科平均分,为学科标准差).
【答案】(1),理由见解析(2)81(3)
【解析】
(1)不剔除两同学的数据,44个数据会使回归效果变差,从而得到,描出回归直线即可;(2)将x=125代入回归直线方程,即可得到答案;(3)利用题目给出的标准分计算公式进行计算即可得到结论.
(1),
说明理由可以是:
①离群点A,B会降低变量间的线性关联程度;
②44个数据点与回归直线的总偏差更大,回归效果更差,所以相关系数更小;
③42个数据点与回归直线的总偏差更小,回归效果更好,所以相关系数更大;
④42个数据点更加贴近回归直线;
⑤44个数据点与回归直线更离散,或其他言之有理的理由均可.
要点:直线斜率须大于0且小于的斜率,具体为止稍有出入没关系,无需说明理由.
(2)令,代入
得
所以,估计同学的物理分数大约为分.
(3)由表中知同学的数学原始分为122,物理原始分为82,
数学标准分为
物理标准分为
,故同学物理成绩比数学成绩要好一些.
【题目】对某种书籍每册的成本费(元)与印刷册数(千册)的数据作了初步处理,得到下面的散点图及一些统计量的值.
4.83 | 4.22 | 0.3775 | 60.17 | 0.60 | -39.38 | 4.8 |
其中,.
为了预测印刷千册时每册的成本费,建立了两个回归模型:,.
(1)根据散点图,你认为选择哪个模型预测更可靠?(只选出模型即可)
(2)根据所给数据和(1)中的模型选择,求关于的回归方程,并预测印刷千册时每册的成本费.
附:对于一组数据,,…,,其回归方程的斜率和截距的最小二乘估计公式分别为:,.