例 5.1.4

easy一级题目发布者: ai-batch

题干

我们考察某厂生产的某种电子元件的寿命，该厂生产的以及将要生产的所有该种元件的寿命是总体（通常可以认为是无限总体），我们选了 100 只进行寿命试验，由于一些原因，我们不可能每时每刻对试验进行观测，而只能定期（比如每隔 24 h）进行观测，于是，对每个元件，我们只能观测到其寿命落在某个范围内，这就产生了表 5.1.1 所示的一组样本：

寿命范围/h	元件数	寿命范围/h	元件数	寿命范围/h	元件数
$(0, 24]$	4	$(192, 216]$	6	$(384, 408]$	4
$(24, 48]$	8	$(216, 240]$	3	$(408, 432]$	4
$(48, 72]$	6	$(240, 264]$	3	$(432, 456]$	1
$(72, 96]$	5	$(264, 288]$	5	$(456, 480]$	2
$(96, 120]$	3	$(288, 312]$	5	$(480, 504]$	2
$(120, 144]$	4	$(312, 336]$	3	$(504, 528]$	3
$(144, 168]$	5	$(336, 360]$	5	$(528, 552]$	1
$(168, 192]$	4	$(360, 384]$	1	$>552$	13

问：什么是分组样本？什么是完全样本？简单随机抽样有哪些要求？设总体 $X$ 具有分布函数 $F(x)$ ， $x_1, x_2, \cdots, x_n$ 为取自该总体的容量为 $n$ 的样本，写出样本联合分布函数。

答案点击展开后可查看解析

解析

表 5.1.1 中的样本观测值没有具体的数值，只有一个范围，这样的样本称为分组样本，它是一种不完全样本。相应地，例 5.1.3 中的 10 个啤酒净含量称为完全样本。分组样本与完全样本相比在信息上总有损失，这是分组样本的缺点。为了获得更多信息，应尽量设法获得完全样本，在不得已场合可使用分组样本（如本例）。但在实际中，在样本量特别大时（如 $n \geqslant 100$ ），又常用分组样本来代替完全样本，这时需要对样本进行分组整理，它能简明扼要地表示样本，使人们能更好地认识总体，这是分组样本的优点。

从总体中抽取样本可以有不同的抽法，为了能由样本对总体作出较可靠的推断，就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求，最常用的"简单随机抽样"有如下两个要求：

样本具有代表性，即要求总体中每一个个体都有同等机会被选入样本，这便意味着每一样品 $x_i$ 与总体 $X$ 有相同的分布。
样本要有独立性，即要求样本中每一样品的取值不影响其他样品的取值，这意味着 $x_1, x_2, \cdots, x_n$ 相互独立。

用简单随机抽样方法得到的样本称为简单随机样本，也简称样本。除非特别指明，本书中的样本皆为简单随机样本。于是，样本 $x_1, x_2, \cdots, x_n$ 可以看成是相互独立的具有同一分布的随机变量，又称为 i.i.d.（独立同分布，independently identically distributed）样本，其共同分布即为总体分布。

设总体 $X$ 具有分布函数 $F(x)$ ， $x_1, x_2, \cdots, x_n$ 为取自该总体的容量为 $n$ 的样本，则样本联合分布函数为

F(x_1, x_2, \cdots, x_n) = \prod_{i=1}^{n} F(x_i).

对无限总体，代表性与独立性容易实现，关键在于排除有意或无意的人为干扰。对有限总体，只要总体所含个体数很大，特别是与样本量相比很大，则独立性也可基本得到满足。

例 5.1.4

题干

解析

评论 0

评论 0