乐湖华研题库
学生教师

例 2.2.2

medium一级题目发布者: ai-batch

题干

例 2.2.2 在一个人数为 NNN 的人群中普查某种疾病,为此要抽验 NNN 个人的血。如果将每个人的血分别检验,则共需检验 NNN 次。为了能减少工作量,一位统计学家提出一种方法:按 kkk 个人一组进行分组,把同组 kkk 个人的血样混合后检验,如果混合血样呈阴性反应,就说明这 kkk 个人的血都呈阴性反应,这 kkk 个人都无此疾病,因而这 kkk 个人只要检验 1 次就够了,相当于每个人检验 1/k1/k1/k 次,检验的工作量明显减少了。如果混合血样呈阳性反应,就说明这 kkk 个人中至少有一人的血呈阳性反应,则再对这 kkk 个人的血样分别进行检验,因而这 kkk 个人的血要检验 1+k1+k1+k 次,相当于每个人检验 1+1/k1+1/k1+1/k 次,这时增加了检验次数。假设该疾病的发病率为 ppp,且得此疾病相互独立。试问此种方法能否减少平均检验次数?

答案点击展开后可查看解析

解析

令 XXX 为该人群中每个人需要的验血次数,则 XXX 的分布列为

XXX1/k1/k1/k1+1/k1+1/k1+1/k
PPP(1−p)k(1-p)^k(1−p)k1−(1−p)k1-(1-p)^k1−(1−p)k

所以每人平均验血次数为

E(X)=1k(1−p)k+(1+1k)[1−(1−p)k]=1−(1−p)k+1k.E(X) = \frac{1}{k}(1-p)^k + \left(1+\frac{1}{k}\right)\left[1-(1-p)^k\right] = 1-(1-p)^k+\frac{1}{k}.E(X)=k1​(1−p)k+(1+k1​)[1−(1−p)k]=1−(1−p)k+k1​.

由此可知,只要选择 kkk 使

1−(1−p)k+1k<1或(1−p)k>1k,1-(1-p)^k+\frac{1}{k}<1 \quad \text{或} \quad (1-p)^k>\frac{1}{k},1−(1−p)k+k1​<1或(1−p)k>k1​,

就可减少验血次数,而且还可适当选择 kkk 使 E(X)E(X)E(X) 达到最小。譬如,当 p=0.1p=0.1p=0.1 时,对不同的 kkk,E(X)E(X)E(X) 的值如表 2.2.1 所示。从表中可以看出:当 k⩾34k \geqslant 34k⩾34 时,平均验血次数超过 1,即比分别检验的工作量还大;而当 k⩽33k \leqslant 33k⩽33 时,平均验血次数在不同程度上得到了减少,特别在 k=4k=4k=4 时,平均验血次数最少,验血工作量可减少 40%。

表 2.2.1 p=0.1p=0.1p=0.1 时的 E(X)E(X)E(X) 值

kkk2345810303334
E(X)E(X)E(X)0.6900.6040.5940.6100.6950.7510.9910.99941.0016

我们也可以对不同的发病率 ppp 计算出最佳的分组人数 k0k_0k0​,见下表 2.2.2。从表中也可以看出:发病率 ppp 越小,则分组检验的效益越大。譬如在 p=0.01p=0.01p=0.01 时,若取 11 人为一组进行验血,则验血工作量可减少 80% 左右。这正是美国二战期间大量征兵时,对新兵验血所采用的减少工作量的措施。

表 2.2.2 不同发病率 ppp 时的最佳分组人数 k0k_0k0​ 及其 E(X)E(X)E(X)

ppp0.140.100.080.060.040.020.01
k0k_0k0​34456811
E(X)E(X)E(X)0.6970.5940.5340.4660.3840.2740.196

评论 0

还没有评论,来说第一句话吧