乐湖华研题库
学生教师

例 7.2.4

hard一级题目发布者: ai-batch

题干

为了比较两种谷物种子的优劣,特选取 10 块土质不全相同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子,施肥与田间管理在 20 小块土地上都是一样,下面是各小块上的单位产量:

土地12345678910
种子一的单位产量 xxx23352942392937343528
种子二的单位产量 yyy30393540383436334131
差 d=x−yd = x - yd=x−y−7-7−7−4-4−4−6-6−621−5-5−511−6-6−6−3-3−3

假定单位产量服从正态分布,试问:两种种子的平均单位产量在显著性水平 α=0.05\alpha = 0.05α=0.05 上有无显著差异?

答案点击展开后可查看解析

解析

假定 x∼N(μ1,σ12)x \sim N(\mu_1, \sigma_1^2)x∼N(μ1​,σ12​),y∼N(μ2,σ22)y \sim N(\mu_2, \sigma_2^2)y∼N(μ2​,σ22​),且 xxx 与 yyy 独立,这里假定两个总体的方差相等是合理的。

方法一:两样本 ttt 检验

记两种种子的单位产量的样本均值分别为 xˉ,yˉ\bar{x}, \bar{y}xˉ,yˉ​,样本方差分别为 sx2,sy2s_x^2, s_y^2sx2​,sy2​。检验问题:

H0:μ1=μ2vsH1:μ1≠μ2H_0: \mu_1 = \mu_2 \quad \text{vs} \quad H_1: \mu_1 \neq \mu_2H0​:μ1​=μ2​vsH1​:μ1​=μ2​

在假设 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2σ12​=σ22​=σ2 下,采用二样本 ttt 检验,检验统计量 t1t_1t1​ 与拒绝域 W1W_1W1​ 分别是

t1=xˉ−yˉsw/n/2,W1={∣t1∣>t1−α/2(2n−2)},t_1 = \frac{\bar{x} - \bar{y}}{s_w / \sqrt{n/2}}, \quad W_1 = \{|t_1| > t_{1-\alpha/2}(2n-2)\},t1​=sw​/n/2​xˉ−yˉ​​,W1​={∣t1​∣>t1−α/2​(2n−2)},

其中 sw2=(sx2+sy2)/2s_w^2 = (s_x^2 + s_y^2)/2sw2​=(sx2​+sy2​)/2。由给出的数据可算得

xˉ=33.1,yˉ=35.7,sx2=33.2111,sy2=14.2333,sw2=23.7222,\bar{x} = 33.1, \quad \bar{y} = 35.7, \quad s_x^2 = 33.2111, \quad s_y^2 = 14.2333, \quad s_w^2 = 23.7222,xˉ=33.1,yˉ​=35.7,sx2​=33.2111,sy2​=14.2333,sw2​=23.7222,

从而可算得两样本的 ttt 检验统计量的值(sw=23.7222=4.8705s_w = \sqrt{23.7222} = 4.8705sw​=23.7222​=4.8705)

t10=33.1−35.74.8705/10/2=−1.1937.t_{10} = \frac{33.1 - 35.7}{4.8705 / \sqrt{10/2}} = -1.1937.t10​=4.8705/10/2​33.1−35.7​=−1.1937.

若给定 α=0.05\alpha = 0.05α=0.05,查表得 t0.975(18)=2.1009t_{0.975}(18) = 2.1009t0.975​(18)=2.1009,由于 ∣t10∣<2.1009|t_{10}| < 2.1009∣t10​∣<2.1009,故不应拒绝原假设,即认为两种种子的单位产量平均值没有显著差别。此处检验的 ppp 值为 0.2480。

方法二:成对数据的 ttt 检验

在这个问题中出现了成对数据,同一块土地上用两种种子得两个产量,其差 di=xi−yid_i = x_i - y_idi​=xi​−yi​(i=1,2,⋯ ,10i = 1, 2, \cdots, 10i=1,2,⋯,10)排除了土质差异这个不可控因素的影响,主要反映两种种子的优劣。

在正态性假定下,d=x−y∼N(μ,σd2)d = x - y \sim N(\mu, \sigma_d^2)d=x−y∼N(μ,σd2​),其中 μ=μ1−μ2\mu = \mu_1 - \mu_2μ=μ1​−μ2​,σd2=σ12+σ22\sigma_d^2 = \sigma_1^2 + \sigma_2^2σd2​=σ12​+σ22​。原先要比较 μ1\mu_1μ1​ 与 μ2\mu_2μ2​ 的大小,如今则转化为考察 μ\muμ 是否为零,即考察如下检验问题:

H0:μ=0vsH1:μ≠0,H_0: \mu = 0 \quad \text{vs} \quad H_1: \mu \neq 0,H0​:μ=0vsH1​:μ=0,

即把双样本的检验问题转化为单样本 ttt 检验问题。这时检验的 ttt 统计量为

t2=dˉsd/n,t_2 = \frac{\bar{d}}{s_d / \sqrt{n}},t2​=sd​/n​dˉ​,

其中

dˉ=1n∑i=1ndi,sd=(1n−1∑i=1n(di−dˉ)2)1/2.\bar{d} = \frac{1}{n}\sum_{i=1}^{n} d_i, \quad s_d = \left(\frac{1}{n-1}\sum_{i=1}^{n}(d_i - \bar{d})^2\right)^{1/2}.dˉ=n1​i=1∑n​di​,sd​=(n−11​i=1∑n​(di​−dˉ)2)1/2.

在给定显著性水平 α\alphaα 下,该检验问题的拒绝域是

W2={∣t2∣⩾t1−α/2(n−1)}.W_2 = \{|t_2| \geqslant t_{1-\alpha/2}(n-1)\}.W2​={∣t2​∣⩾t1−α/2​(n−1)}.

在本例中可算得

n=10,dˉ=−2.6,sd=3.5024,n = 10, \quad \bar{d} = -2.6, \quad s_d = 3.5024,n=10,dˉ=−2.6,sd​=3.5024,

于是

t20=−2.63.5024/10=−2.61.1076=−2.3475.t_{20} = \frac{-2.6}{3.5024 / \sqrt{10}} = \frac{-2.6}{1.1076} = -2.3475.t20​=3.5024/10​−2.6​=1.1076−2.6​=−2.3475.

对给定的显著性水平 α=0.05\alpha = 0.05α=0.05,可查表得 t0.975(9)=2.2622t_{0.975}(9) = 2.2622t0.975​(9)=2.2622。由于 ∣t20∣>2.2622|t_{20}| > 2.2622∣t20​∣>2.2622,故应拒绝原假设 H0:μ=0H_0: \mu = 0H0​:μ=0,即可认为两种种子的平均单位产量有显著差异,此处检验的 ppp 值为 0.0435。进一步,平均单位产量差的估计量为 μ^=xˉ−yˉ=−2.6\hat{\mu} = \bar{x} - \bar{y} = -2.6μ^​=xˉ−yˉ​=−2.6,可见种子 yyy 要比种子 xxx 的平均单位产量高。

两种方法的比较

本问题中两种处理方法得到完全不同的结论,我们指出成对数据 ttt 检验方法更加合理。这是因为成对数据的差 did_idi​ 已消除了试验单元(如土质)之间的差别,从而用于检验的标准差 sd=3.5024s_d = 3.5024sd​=3.5024 已排除土质差异的影响,只保留种子间的差异。而二样本 ttt 检验中用于检验的标准差 sw=4.8705s_w = 4.8705sw​=4.8705 还含有土质差异,从而使得标准差增大,导致因子不显著。所以成对数据场合化为单样本 ttt 检验所作的结论更可信些。

应注意,成对数据的获得事先要作周密的安排(即试验设计)。在获得成对数据时不能发生"错位",从而准确获得"成对数据"的信息。

评论 0

还没有评论,来说第一句话吧