题目内容

【题目】唐诗是中国文学的瑰宝.为了研究计算机上唐诗分类工作中检索关键字的选取,某研究人员将唐诗分成7大类别,并从《全唐诗》48900多篇唐诗中随机抽取了500篇,统计了每个类别及各类别包含“花”、“山”、“帘”字的篇数,得到下表:

爱情婚姻

咏史怀古

边塞战争

山水田园

交游送别

羁旅思乡

其他

总计

篇数

100

64

55

99

91

73

18

500

含“山”字的篇数

51

48

21

69

48

30

4

271

含“帘”字的篇数

21

2

0

0

7

3

5

38

含“花”字的篇数

60

6

14

17

32

28

3

160

1)根据上表判断,若从《全唐诗》含“山”字的唐诗中随机抽取一篇,则它属于哪个类别的可能性最大,属于哪个类别的可能性最小,并分别估计该唐诗属于这两个类别的概率;

2)已知检索关键字的选取规则为:

①若有超过95%的把握判断“某字”与“某类别”有关系,则“某字”为“某类别”的关键字;

②若“某字”被选为“某类别”关键字,则由其对应列联表得到的的观测值越大,排名就越靠前;

设“山”“帘”“花”和“爱情婚姻”对应的观测值分别为.已知,请完成下面列联表,并从上述三个字中选出“爱情婚姻”类别的关键字并排名.

属于“爱情婚姻”类

不属于“爱情婚姻”类

总计

含“花”字的篇数

不含“花”的篇数

总计

附:,其中.

0.05

0.025

0.010

3.841

5.024

6.635

【答案】1)该唐诗属于“山水田园”类别的可能性最大,属于“其他”类别的可能性最小;属于“山水田园”类别的概率约为;属于“其他”类别的概率约为2)填表见解析;选择“花”,“帘”作为“爱情婚姻”类别的关键字,且排序为“花”,“帘”

【解析】

1)根据统计图表算出频率,比较大小即可判断;

2)根据统计图表完成列联表,算出观测值,查表判断.

1)由上表可知,

该唐诗属于“山水田园”类别的可能性最大,属于“其他”类别的可能性最小

属于“山水田园”类别的概率约为;属于“其他”类别的概率约为

2)列联表如下:

属于“爱情婚姻”类

不属于“爱情婚姻”类

共计

含“花”的篇数

60

100

160

不含“花”的篇数

40

300

340

共计

100

400

500

计算得:

因为,所以有超过95%的把握判断“花”字和“帘”字均与“爱情婚姻”有关系,故“花”和“帘”是“爱情婚姻”的关键字,而“山”不是;

又因为,故选择“花”,“帘”作为“爱情婚姻”类别的关键字,且排序为“花”,“帘”.

练习册系列答案
相关题目

违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com

精英家教网