题目内容
【题目】指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当数值大于或等于20.5时,我们说体重较重,当数值小于20.5时,我们说体重较轻,身高大于或等于我们说身高较高,身高小于170cm我们说身高较矮.
(1)已知某高中共有32名男体育特长生,其身高与指数的数据如散点图,请根据所得信息,完成下述列联表,并判断是否有的把握认为男生的身高对指数有影响.
身高较矮 | 身高较高 | 合计 | |
体重较轻 | |||
体重较重 | |||
合计 |
(2)①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高 | 166 | 167 | 160 | 173 | 178 | 169 | 158 | 173 |
体重 | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
根据最小二乘法的思想与公式求得线性回归方程为.利用已经求得的线性回归方程,请完善下列残差表,并求(解释变量(身高)对于预报变量(体重)变化的贡献值)(保留两位有效数字);
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
体重(kg) | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
残差 |
②通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为.小明重新根据最小二乘法的思想与公式,已算出,请在小明所算的基础上求出男体育特长生的身高与体重的线性回归方程.
参考数据:
,,
,,
参考公式:,,,,.
0.10 | 0.05 | 0.01 | 0.005 | |
2.706 | 3.811 | 6.635 | 7.879 |
【答案】(1)答案见解析;没有的把握认为男生的身高对指数有影响;(2)①填表见解析;;②
【解析】
(1)根据题意,由身高和体重的数据表可列联表,进而计算的值,分析可得答案;(2) ① 由题意计算对应的残差值,完善残差表即可;由公式计算R2即可得出结论②由计算知残差的最大的那组数据为第8组,计算修订后的,求出得到线性回归方程.
(1)
身高较矮 | 身高较高 | 合计 | |
体重较轻 | 6 | 15 | 21 |
体重较重 | 6 | 5 | 11 |
合计 | 12 | 20 | 32 |
由于,
因此没有的把握认为男生的身高对指数有影响.
(2)①对编号为8的数据,完成残差表如下所示:
编号 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
体重 | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
残差 | 0.1 | 0.3 | 0.9 | 3.5 |
.
所以解释变量(身高)对于预报变量(体重)变化的贡献值约为0.91.
②由①可知,第八组数据的体重应为58.由已知 ,
又,
代入可得:,
所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为.
【题目】在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主
创业,该专营店统计了近五年来创收利润数(单位:万元)与时间(单位:年)的数据,列表如下:
1 | 2 | 3 | 4 | 5 | |
2.4 | 2.7 | 4.1 | 6.4 | 7.9 |
(Ⅰ)依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合):
(Ⅱ)该专营店为吸引顾客,特推出两种促销方案.
方案一:每满500元可减50元;
方案二:每满500元可抽奖一次,每次中奖的概率都为,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.
①某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客获得100元现金奖励的概率.
②某位顾客购买了1500元的产品,作为专营店老板,是希望该顾客直接选择返回150元现金,还是选择参加三次抽奖?说明理由
附:相关系数公式
参考数据:.
【题目】2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善生存环境质量.某部门在某小区年龄处于区间内的人中随机抽取人进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到图各年龄段人数的频率分布直方图和表中统计数据.
(1)求的值;
(2)根据频率分布直方图,估计这人年龄的平均值(同一组数据用该组区间的中点值代替,结果保留整数);
(3)从年龄段在的“环保族”中采用分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在区间中的概率.
组数 | 分组 | “环保族”人数 | 占本组频率 |
第一组 | 45 | 0.75 | |
第二组 | 25 | ||
第三组 | 0.5 | ||
第四组 | 3 | 0.2 | |
第五组 | 3 | 0.1 |
【题目】某学校为了调查学生数学素养的情况,从初中部、高中部各随机抽取100名学生进行测试.初中部的100名学生的成绩(单位:分)的频率分布直方图如图所示.
高中部的100名学生的成绩(单位:分)的频数分布表如下:
测试分数 | |||||
频数 | 5 | 20 | 35 | 25 | 15 |
把成绩分为四个等级:60分以下为级,60分(含60)到80分为级,80分(含80)到90分为级,90分(含90)以上为级.
(1)根据已知条件完成下面的列联表,据此资料你是否有99%的把握认为学生数学素养成绩“级”与“所在级部”有关?
不是级 | 级 | 合计 | |
初中部 | |||
高中部 | |||
合计 |
注:,其中.
0.050 | 0.010 | 0.001 | |
3.841 | 6.635 | 10.828 |
(2)若这个学校共有9000名高中生,用频率估计概率,用样本估计总体,试估计这个学校的高中生的数学素养成绩为级的人数,并估计数学素养成绩的平均分(用组中值代表本组分数);
(3)把初中部的级同学编号为,,,,,高中部的级同学编号为,,,,,从初中部级、高中部级中各选一名同学,求这两名同学的编号奇偶性相同的概率.