题目内容
【题目】为了纪念“一带一路”倡议提出五周年,某城市举办了一场知识竞赛,为了了解市民对“一带一路”知识的掌握情况,从回收的有效答卷中按青年组和老年组各随机抽取了40份答卷,发现成绩都在内,现将成绩按区间,,,,进行分组,绘制成如下的频率分布直方图.
青年组
中老年组
(1)利用直方图估计青年组的中位数和老年组的平均数;
(2)从青年组,的分数段中,按分层抽样的方法随机抽取5份答卷,再从中选出3份答卷对应的市民参加政府组织的座谈会,求选出的3位市民中有2位来自分数段的概率.
【答案】(1)中位数为80,平均数为(2)
【解析】
(1)根据中位数使得左右两边的面积相等,可以确定中位数,再根据在频率分布直方图计算平均数的方法计算即可求出平均数;
(2) 求邮青年组,的分数段中答卷的份数,再求出抽取比例,最后确定两段中分别抽取的答卷份数, 记中的3位市民为,,,中的2位市民为,,列出可能出现的情况,最后求出选出的3位市民中有2位来自分数段的概率.
解:(1)由青年组的频率分布直方图可知,前3个小矩形的面积和为,后2个小矩形的面积和为,所以中位数为80.
中老年组成绩的平均数为.
(2)青年组,的分数段中答卷分别为12份,8份,
抽取比例为,所以两段中分别抽取的答卷分别为3份,2份.
记中的3位市民为,,,中的2位市民为,,
则从中选出3位市民,共有不同选法种数10种:
,,,,
,,,,,.
其中,有2位来自的有3种:,,.
所以所求概率.
【题目】2019年12月以来,湖北省武汉市持续开展流感及相关疾病监测,发现多起病毒性肺炎病例,均诊断为病毒性肺炎/肺部感染,后被命名为新型冠状病毒肺炎(CoronaVirusDisease2019,COVID—19),简称“新冠肺炎”.下图是2020年1月15日至1月24日累计确诊人数随时间变化的散点图.
为了预测在未釆取强力措施下,后期的累计确诊人数,建立了累计确诊人数y与时间变量t的两个回归模型,根据1月15日至1月24日的数据(时间变量t的值依次1,2,…,10)建立模型和.
(1)根据散点图判断,与哪一个适宜作为累计确诊人数y与时间变量t的回归方程类型?(给出判断即可,不必说明理由)
(2根据(1)的判断结果及附表中数据,建立y关于x的回归方程;
(3)以下是1月25日至1月29日累计确诊人数的真实数据,根据(2)的结果回答下列问题:
时间 | 1月25日 | 1月26日 | 1月27日 | 1月28日 | 1月29日 |
累计确诊人数的真实数据 | 1975 | 2744 | 4515 | 5974 | 7111 |
(ⅰ)当1月25日至1月27日这3天的误差(模型预测数据与真实数据差值的绝对值与真实数据的比值)都小于0.1则认为模型可靠,请判断(2)的回归方程是否可靠?
(ⅱ)2020年1月24日在人民政府的强力领导下,全国人民共同采取了强力的预防“新冠肺炎”的措施,若采取措施5天后,真实数据明显低于预测数据,则认为防护措施有效,请判断预防措施是否有效?
附:对于一组数据(,,……,,其回归直线的斜率和截距的最小二乘估计分别为,.
参考数据:其中,.
5.5 | 390 | 19 | 385 | 7640 | 31525 | 154700 | 100 | 150 | 225 | 338 | 507 |
【题目】某研究公司为了调查公众对某事件的关注程度,在某年的连续6个月内,月份和关注人数(单位:百)()数据做了初步处理,得到下面的散点图及一些统计量的值.
17.5 | 35 | 36.5 |
(1)由散点图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明,并建立y关于x的回归方程;
(2)经统计,调查材料费用v(单位:百元)与调查人数满足函数关系,求材料费用的最小值,并预测此时的调查人数;
(3)现从这6个月中,随机抽取3个月份,求关注人数不低于1600人的月份个数分布列与数学期望.
参考公式:相关系数,若,则y与x的线性相关程度相当高,可用线性回归模型拟合y与x的关系.回归方程中斜率与截距的最小二乘估计公式分别为,.