题目内容
【题目】唐诗是中国文学的瑰宝.为了研究计算机上唐诗分类工作中检索关键字的选取,某研究人员将唐诗分成7大类别,并从《全唐诗》48900多篇唐诗中随机抽取了500篇,统计了每个类别及各类别包含“花”、“山”、“帘”字的篇数,得到下表:
爱情婚姻 | 咏史怀古 | 边塞战争 | 山水田园 | 交游送别 | 羁旅思乡 | 其他 | 总计 | |
篇数 | 100 | 64 | 55 | 99 | 91 | 73 | 18 | 500 |
含“山”字的篇数 | 51 | 48 | 21 | 69 | 48 | 30 | 4 | 271 |
含“帘”字的篇数 | 21 | 2 | 0 | 0 | 7 | 3 | 5 | 38 |
含“花”字的篇数 | 60 | 6 | 14 | 17 | 32 | 28 | 3 | 160 |
(1)根据上表判断,若从《全唐诗》含“山”字的唐诗中随机抽取一篇,则它属于哪个类别的可能性最大,属于哪个类别的可能性最小,并分别估计该唐诗属于这两个类别的概率;
(2)已知检索关键字的选取规则为:
①若有超过95%的把握判断“某字”与“某类别”有关系,则“某字”为“某类别”的关键字;
②若“某字”被选为“某类别”关键字,则由其对应列联表得到的的观测值越大,排名就越靠前;
设“山”“帘”“花”和“爱情婚姻”对应的观测值分别为,,.已知,,请完成下面列联表,并从上述三个字中选出“爱情婚姻”类别的关键字并排名.
属于“爱情婚姻”类 | 不属于“爱情婚姻”类 | 总计 | |
含“花”字的篇数 | |||
不含“花”的篇数 | |||
总计 |
附:,其中.
0.05 | 0.025 | 0.010 | |
3.841 | 5.024 | 6.635 |
【答案】(1)该唐诗属于“山水田园”类别的可能性最大,属于“其他”类别的可能性最小;属于“山水田园”类别的概率约为;属于“其他”类别的概率约为(2)填表见解析;选择“花”,“帘”作为“爱情婚姻”类别的关键字,且排序为“花”,“帘”
【解析】
(1)根据统计图表算出频率,比较大小即可判断;
(2)根据统计图表完成列联表,算出观测值,查表判断.
(1)由上表可知,
该唐诗属于“山水田园”类别的可能性最大,属于“其他”类别的可能性最小
属于“山水田园”类别的概率约为;属于“其他”类别的概率约为;
(2)列联表如下:
属于“爱情婚姻”类 | 不属于“爱情婚姻”类 | 共计 | |
含“花”的篇数 | 60 | 100 | 160 |
不含“花”的篇数 | 40 | 300 | 340 |
共计 | 100 | 400 | 500 |
计算得:;
因为,,所以有超过95%的把握判断“花”字和“帘”字均与“爱情婚姻”有关系,故“花”和“帘”是“爱情婚姻”的关键字,而“山”不是;
又因为,故选择“花”,“帘”作为“爱情婚姻”类别的关键字,且排序为“花”,“帘”.
【题目】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了个网箱,测量各水箱产品的产量(单位:kg),其频率分布直方图如下图所示.
(1)若用频率视为概率,记表示事件“旧养殖法的箱产量低于kg”,求事件的概率;
(2)填写以下列联表,并根据此判断是否有的把握认为箱产量与养殖方法有关?
箱产量kg | 箱产量kg | 合计 | |
旧养殖方法 | |||
新养殖方法 | |||
合计 |
(3)根据箱产量频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到)