题目内容
| 表1 | ||
| 分组(单位:个) | 频数 | 频率 |
| [10,15) | 5 | 0.050 |
| [15,20) | 20 | 0.200 |
| [20,25) | ① | 0.350 |
| [25,30) | 30 | ② |
| [30,35) | 10 | 0.100 |
| 合计 | 100 | 1.00 |
(Ⅱ)下面是3月1日至5日每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数的详细记录:
| 表2 | |||||
| 日期 | 3月1日 | 3月2日 | 3月3日 | 3月4日 | 3月2日 |
| 温差(℃) | 10 | 11 | 13 | 12 | 8 |
| 发芽数(颗) | 23 | 25 | 30 | 26 | 16 |
(ii)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(i)中所得的线性回归方程是否可靠?(6分)
(参考公式:
| ? |
| b |
| |||||||
|
| a |
. |
| y |
| b |
. |
| x |
考点:线性回归方程
专题:概率与统计
分析:(Ⅰ)根据各组累积频数等于样本容量,可得①的值,进而根据频率=
得到②的值,结合组距为5,矩形的高=
计算出各组矩形的高,可得频率分布折线图;累加各组的组中值和频率的积,可估计出100天里种子发芽的平均值;
(Ⅱ)(i)根据所给的数据,先做出x,y的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.
(ii)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的;
| 频数 |
| 样本容量 |
| 频率 |
| 组距 |
(Ⅱ)(i)根据所给的数据,先做出x,y的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.
(ii)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的;
解答:
解:(Ⅰ)各组累积频数等于样本容量,
由100-(5+20+30+10)=35,可知:①中应填35,
根据频率=
,由
=0.30可知:②中应填0.30,
根据矩形的高=
,可得
各组数据在频率分布直方图中对应矩形的高依次为:0.01,0.04,0.07,0.06,0.02,
故频率分布直方图和频率分布折线图如下图所示:

由12.5×0.05×17.5×0.20+22.5×0.35+27.5×0.30+32.5×0.10=23.5得:
估计100天里种子发芽的平均值为23.5颗.
(Ⅱ)(i)由数据,求得
=12,
=27.
代入回归系数公式解得
=
,
∴
=
-
=-3
∴y关于x的线性回归方程为
=
x-3;
(ii)当x=10时,
=22,|22-23|<2;
当x=8时,
=17,|17-16|<2
∴该研究所得到的线性回归方程是可靠的;
由100-(5+20+30+10)=35,可知:①中应填35,
根据频率=
| 频数 |
| 样本容量 |
| 30 |
| 100 |
根据矩形的高=
| 频率 |
| 组距 |
各组数据在频率分布直方图中对应矩形的高依次为:0.01,0.04,0.07,0.06,0.02,
故频率分布直方图和频率分布折线图如下图所示:
由12.5×0.05×17.5×0.20+22.5×0.35+27.5×0.30+32.5×0.10=23.5得:
估计100天里种子发芽的平均值为23.5颗.
(Ⅱ)(i)由数据,求得
. |
| x |
. |
| y |
代入回归系数公式解得
| ? |
| b |
| 5 |
| 2 |
∴
| ? |
| a |
. |
| y |
| ? |
| b |
. |
| x |
∴y关于x的线性回归方程为
| ? |
| y |
| 5 |
| 2 |
(ii)当x=10时,
| ? |
| y |
当x=8时,
| ? |
| y |
∴该研究所得到的线性回归方程是可靠的;
点评:本题考查线性回归方程的求法,考查最小二乘法,考查估计验算所求的方程是否是可靠的,是一个综合题目.
练习册系列答案
相关题目