题目内容
【题目】随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大.某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取50个用户,按年龄分组进行访谈,统计结果如表.
组号 | 年龄 | 访谈人数 | 愿意使用 |
1 | [18,28) | 4 | 4 |
2 | [28,38) | 9 | 9 |
3 | [38,48) | 16 | 15 |
4 | [48,58) | 15 | 12 |
5 | [58,68) | 6 | 2 |
(Ⅰ)若在第2、3、4组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取12人,则各组应分别抽取多少人?
(Ⅱ)若从第5组的被调查者访谈人中随机选取2人进行追踪调查,求2人中至少有1人愿意选择此款“流量包”套餐的概率.
(Ⅲ)按以上统计数据填写下面2×2列联表,并判断以48岁为分界点,能否在犯错误不超过1%的前提下认为,是否愿意选择此款“流量包”套餐与人的年龄有关?
年龄不低于48岁的人数 | 年龄低于48岁的人数 | 合计 | |
愿意使用的人数 | |||
不愿意使用的人数 | |||
合计 |
参考公式: ,其中:n=a+b+c+d.
P(k2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
【答案】解:(Ⅰ)因为 , , ,
所以第2、3、4组愿意选择此款“流量包”套餐的人中,
用分层抽样的方法抽取12人,各组分别为3人,5人,4人;
(Ⅱ)第5组的6人中,不愿意选择此款“流量包”套餐的4人,
分别记作:A、B、C、D,
愿意选择此款“流量包”套餐2人,分别记作x、y;
由题可知 ;
(Ⅲ)2×2列联表:
年龄不低于48岁的人数 | 年龄低于48岁的人数 | 合计 | |
愿意使用的人数 | 14 | 28 | 42 |
不愿意使用的人数 | 7 | 1 | 8 |
合计 | 21 | 29 | 50 |
计算 ,
∴在犯错误不超过1%的前提下可以认为,是否愿意选择此款“流量包”套餐与人的年龄有关.
【解析】(Ⅰ)根据频率分布表,利用分层抽样原理求出分别抽取的人数;(Ⅱ)利用列举法求出基本事件数,计算对应的概率值;(Ⅲ)根据题意填写列联表,计算观测值,对照临界值得出结论.
【题目】为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型① 与模型;② 作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/°C | 20 | 22 | 24 | 26 | 28 | 30 | 32 |
产卵数y/个 | 6 | 10 | 21 | 24 | 64 | 113 | 322 |
t=x2 | 400 | 484 | 576 | 676 | 784 | 900 | 1024 |
z=lny | 1.79 | 2.30 | 3.04 | 3.18 | 4.16 | 4.73 | 5.77 |
|
|
|
|
26 | 692 | 80 | 3.57 |
|
|
|
|
1157.54 | 0.43 | 0.32 | 0.00012 |
其中 , ,zi=lnyi , ,
附:对于一组数据(μ1 , ν1),(μ2 , ν2),(μn , νn),其回归直线v=βμ+α的斜率和截距的最小二乘估计分别为: ,
(1)根据表中数据,分别建立两个模型下y关于x的回归方程;并在两个模型下分别估计温度为30°C时的产卵数.(C1 , C2 , C3 , C4与估计值均精确到小数点后两位)(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
(2)若模型①、②的相关指数计算分别为 .,请根据相关指数判断哪个模型的拟合效果更好.