题目内容
【题目】2018年11月5日至10日,首届中国国际进口博览会在国家会展中心(上海)举行,吸引过来58个“一带一路”沿线国家的超过1000多家企业参展,成为共建“一带一路”的又一个重要支撑。某企业为了参加这次盛会,提升行业竞争力,加大了科技投入;该企业连续6年来得科技投入(百万元)与收益(百万元)的数据统计如下:
根据散点图的特点,甲认为样本点分布在指数曲线的周围,据此他对数据进行了一些初步处理,如下表:
其中,.
(1)()请根据表中数据,建立关于的回归方程(保留一位小数);
()根据所建立回归方程,若该企业想在下一年的收益达到2亿,则科技投入的费用至少要多少(其中)?
(2)乙认为样本点分布在二次曲线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲乙两位员工所建立的模型,谁的拟合效果更好.
附:对于一组数据,,……,其回归直线方程的斜率和截距的最小二乘估计分别为,,相关指数:.
【答案】(1)(i);(ii);(2)甲建立的回归模型拟合效果更好
【解析】
(1)通过,将非线性回归问题,转化为线性回归问题,利用线性回归直线方程计算公式计算出线性回归直线,再还原为非线性回归方程.并由此列不等式,求得科技投入的费用至少需要的值.
(2)计算出模型甲残差平方和,由此计算出模型甲的相关指数,比较甲乙两个模型的相关指数,由此确定拟合效果较好的模型.
(1)(),令.
令,则,根据最小二乘估计可知.
从而,故回归方程为,也即.
()设,解得=>.
(2)先计算残差:
则,从而.
即甲建立的回归模型拟合效果更好.
【题目】为了打好“精准扶贫攻坚战”某村扶贫书记打算带领该村农民种植新品种蔬菜,可选择的种植量有三种:大量种植,适量种植,少量种植.根据收集到的市场信息,得到该地区该品种蔬菜年销量频率分布直方图如图,然后,该扶贫书记同时调查了同类其他地区农民以往在各种情况下的平均收入如表1(表中收入单位:万元):
表1
销量 种植量 | 好 | 中 | 差 |
大量 | 8 | -4 | |
适量 | 9 | 7 | 0 |
少量 | 4 | 4 | 2 |
但表格中有一格数据被墨迹污损,好在当时调查的数据频数分布表还在,其中大量种植的100户农民在市场销量好的情况下收入情况如表2:
收入(万元) | 11 | 11.5 | 12 | 12.5 | 13 | 13.5 | 14 | 14.5 | 15 |
频数(户) | 5 | 10 | 15 | 10 | 15 | 20 | 10 | 10 | 5 |
(Ⅰ)根据题中所给数据,请估计在市场销量好的情况下,大量种植的农民每户的预期收益.(用以往平均收入来估计);
(Ⅱ)若该地区年销量在10千吨以下表示销量差,在10千吨至30千吨之间表示销量中,在30千吨以上表示销量好,试根据频率分布直方图计算销量分别为好、中、差的概率(以频率代替概率);
(Ⅲ)如果你是这位扶贫书记,请根据(Ⅰ)(Ⅱ),从农民预期收益的角度分析,你应该选择哪一种种植量.