题目内容
【题目】2019年是扶贫的关键年,作为产业扶贫的电商扶贫将会迎来更多的政策或扶持.京东、阿里、拼多多、抖音、苏宁等互联网公司都纷纷加入电商扶贫.城乡各地区都展开农村电商培训,如对电商团队、物流企业、返乡创业群体、普通农户等进行培训.某部门组织A、B两个调查小组在开展电商培训之前先进行问卷调查,从获取的有效问卷中,针对25至55岁的人群,接比例随机抽取400份,进行数据统计,具体情况如下表:
A组统计结果 | B组统计结果 | |||
参加电商培训 | 不参加电商培训 | 参加电商培训 | 不参加电商培训 | |
50 | 25 | 45 | 20 | |
35 | 43 | 30 | 32 | |
20 | 60 | 20 | 20 |
(1)先用分层抽样的方法从400人中按“年龄是否达到45岁”抽出一个容量为80的样本,将“年龄达到45岁”的被抽个体分配到“参加电商培训”和“不参加电商培训”中去。
①这80人中“年龄达到45岁且参加电商培训”的人数;
②调查组从所抽取的“年龄达到45岁且参加电商培训”的人员中抽取3人,安排进入抖音公司参观学习,求这3人恰好是A组的人数X的分布列和数学期望;
(2)从统计数据可直观得出“参加电商培训与年龄(记作m岁)有关”的结论.请列出列联表,用独立性检验的方法,通过比较的观测值的大小,判断年龄取35岁还是45岁时犯错误的概率哪一个更小?
(参考公式:,其中)
【答案】(1)8(2)①见解析②
【解析】
(1)①由分层抽样可得;②“参加培训年龄达到45岁”的A组4人,B组4人,可得分布列和期望;(2)分别做出35岁和45岁的列联表,根据公式计算两者的概率k,比较概率大小,即可得出结论。
解:(1)①.400人中抽取80人,其中年龄达到45岁且参加培训的有人,
②.抽取的A组人年龄达到45岁参加培训的有4人,所以抽取的3人中A组人数X的可能取值为0,1,2,3
,,
,
所以X的分布列为:
X | 0 | 1 | 2 | 3 |
P |
(2)按年龄是否达到35岁,整理数据得到如下列联表:
参加电商培训 | 不参加电商培训 | 合计 | |
未达到35岁 | 95 | 45 | 140 |
达到35岁 | 105 | 155 | 260 |
合计 | 200 | 200 | 400 |
所以时,的观测值
按年龄是否达到45岁,整理数据得到如下列联表:
参加电商培训 | 不参加电商培训 | 合计 | |
未达到45岁 | 160 | 120 | 280 |
达到45岁 | 40 | 80 | 120 |
合计 | 200 | 200 | 400 |
所以时,的观测值
因为,欲使犯错误的概率尽可能小,取.