【题目】唐诗是中国文学的瑰宝.为了研究计算机上唐诗分类工作中检索关键字的选取,某研究人员将唐诗分成7大类别,并从《全唐诗》48900多篇唐诗中随机抽取了500篇,统计了每个类别及各类别包含“花”、“山”、“帘”字的篇数,得到下表:
爱情婚姻 | 咏史怀古 | 边塞战争 | 山水田园 | 交游送别 | 羁旅思乡 | 其他 | 总计 | |
篇数 | 100 | 64 | 55 | 99 | 91 | 73 | 18 | 500 |
含“山”字的篇数 | 51 | 48 | 21 | 69 | 48 | 30 | 4 | 271 |
含“帘”字的篇数 | 21 | 2 | 0 | 0 | 7 | 3 | 5 | 38 |
含“花”字的篇数 | 60 | 6 | 14 | 17 | 32 | 28 | 3 | 160 |
(1)根据上表判断,若从《全唐诗》含“山”字的唐诗中随机抽取一篇,则它属于哪个类别的可能性最大,属于哪个类别的可能性最小,并分别估计该唐诗属于这两个类别的概率;
(2)已知检索关键字的选取规则为:
①若有超过95%的把握判断“某字”与“某类别”有关系,则“某字”为“某类别”的关键字;
②若“某字”被选为“某类别”关键字,则由其对应列联表得到的的观测值越大,排名就越靠前;
设“山”“帘”“花”和“爱情婚姻”对应的观测值分别为,,.已知,,请完成下面列联表,并从上述三个字中选出“爱情婚姻”类别的关键字并排名.
属于“爱情婚姻”类 | 不属于“爱情婚姻”类 | 总计 | |
含“花”字的篇数 | |||
不含“花”的篇数 | |||
总计 |
附:,其中.
0.05 | 0.025 | 0.010 | |
3.841 | 5.024 | 6.635 |