16.已知数据x1,x2,x3,…,x100是杭州市100个普通职工的2016年10月份的收入(均不超过2万元),设这100个数据的中位数为x,平均数为y,方差为z,如果再加上马云2016年10月份的收入x101(约100亿元),则相对于x、y、z,这101个月收入数据( )
| A. | 平均数可能不变,中位数可能不变,方差可能不变 | |
| B. | 平均数大大增大,中位数可能不变,方差也不变 | |
| C. | 平均数大大增大,中位数一定变大,方差可能不变 | |
| D. | 平均数大大增大,中位数可能不变,方差变大 |
15.从1003名学生中选出50个代表,先用简单随机抽样剔除3人,再将剩下的1000人均分成20组,采用系统抽样方法选出50人,则每个人被选中的概率均为( )
| A. | $\frac{1}{50}$ | B. | $\frac{1}{20}$ | C. | $\frac{20}{1003}$ | D. | $\frac{50}{1003}$ |
13.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某农科所记录了5组昼夜温差与100颗种子发芽数,得到如表资料:
该所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求出线性回归方程,再对被选取的2组数据进行检验.
(1)若选取的是第1组与第5组的两组数据,请根据第2组至第4组的数据,求出y关于x的线性回归方程$\widehaty$=$\widehatb$x+$\widehata$;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(参考公式:$\widehatb$=$\frac{{\sum_{i=1}^n{({x_i}-\overline x)({y_i}-\overline y)}}}{{\sum_{i=1}^n{{{({x_i}-\overline x)}^2}}}}$=$\frac{{\sum_{i=1}^n{{x_i}{y_i}-n\overline x\overline y}}}{{\sum_{i=1}^n{{x_i}^2-n{{\overline x}^2}}}}$,$\widehata$=$\overline y$-$\widehatb$$\overline x$)
| 组号 | 1 | 2 | 3 | 4 | 5 |
| 温差x(°C) | 10 | 11 | 13 | 12 | 8 |
| 发芽数y(颗) | 23 | 25 | 30 | 26 | 16 |
(1)若选取的是第1组与第5组的两组数据,请根据第2组至第4组的数据,求出y关于x的线性回归方程$\widehaty$=$\widehatb$x+$\widehata$;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(参考公式:$\widehatb$=$\frac{{\sum_{i=1}^n{({x_i}-\overline x)({y_i}-\overline y)}}}{{\sum_{i=1}^n{{{({x_i}-\overline x)}^2}}}}$=$\frac{{\sum_{i=1}^n{{x_i}{y_i}-n\overline x\overline y}}}{{\sum_{i=1}^n{{x_i}^2-n{{\overline x}^2}}}}$,$\widehata$=$\overline y$-$\widehatb$$\overline x$)
12.
某制造厂商10月份生产了一批乒乓球,从中随机抽取n个进行检查,测得每个球的直径(单位:mm),将数据进行分组,得到如表频率分布表:
(1)求a、b、n及P1、P2的值,并画出频率分布直方图(结果保留两位小数);
(2)已知标准乒乓球的直径为40.00mm,直径误差不超过0.01mm的为五星乒乓球,若这批乒乓球共有10000个,试估计其中五星乒乓球的数目;
(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40.00)作为代表,估计这批乒乓球直径的平均值和中位数.
| 分组 | 频数 | 频率 |
| [39.95,39.97) | 6 | P1 |
| [39.97,39.99) | 12 | 0.20 |
| [39.99,40.01) | a | 0.50 |
| [40.01,40.03) | b | P2 |
| 合计 | n | 1.00 |
(2)已知标准乒乓球的直径为40.00mm,直径误差不超过0.01mm的为五星乒乓球,若这批乒乓球共有10000个,试估计其中五星乒乓球的数目;
(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40.00)作为代表,估计这批乒乓球直径的平均值和中位数.
8.运行如图所示的程序框图,若输出的结果为$\frac{50}{101}$,则判断框内可以填( )

0 233696 233704 233710 233714 233720 233722 233726 233732 233734 233740 233746 233750 233752 233756 233762 233764 233770 233774 233776 233780 233782 233786 233788 233790 233791 233792 233794 233795 233796 233798 233800 233804 233806 233810 233812 233816 233822 233824 233830 233834 233836 233840 233846 233852 233854 233860 233864 233866 233872 233876 233882 233890 266669
| A. | k>98? | B. | k≥99? | C. | k≥100? | D. | k>101? |