我们考察某厂生产的某种电子元件的寿命,该厂生产的以及将要生产的所有该种元件的寿命是总体(通常可以认为是无限总体),我们选了 100 只进行寿命试验,由于一些原因,我们不可能每时每刻对试验进行观测,而只能定期(比如每隔 24 h)进行观测,于是,对每个元件,我们只能观测到其寿命落在某个范围内,这就产生了表 5.1.1 所示的一组样本:
| 寿命范围/h | 元件数 | 寿命范围/h | 元件数 | 寿命范围/h | 元件数 |
|---|---|---|---|---|---|
| 4 | 6 | 4 | |||
| 8 | 3 | 4 | |||
| 6 | 3 | 1 | |||
| 5 | 5 | 2 | |||
| 3 | 5 | 2 | |||
| 4 | 3 | 3 | |||
| 5 | 5 | 1 | |||
| 4 | 1 | 13 |
问:什么是分组样本?什么是完全样本?简单随机抽样有哪些要求?设总体 具有分布函数 , 为取自该总体的容量为 的样本,写出样本联合分布函数。
表 5.1.1 中的样本观测值没有具体的数值,只有一个范围,这样的样本称为分组样本,它是一种不完全样本。相应地,例 5.1.3 中的 10 个啤酒净含量称为完全样本。分组样本与完全样本相比在信息上总有损失,这是分组样本的缺点。为了获得更多信息,应尽量设法获得完全样本,在不得已场合可使用分组样本(如本例)。但在实际中,在样本量特别大时(如 ),又常用分组样本来代替完全样本,这时需要对样本进行分组整理,它能简明扼要地表示样本,使人们能更好地认识总体,这是分组样本的优点。
从总体中抽取样本可以有不同的抽法,为了能由样本对总体作出较可靠的推断,就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求,最常用的"简单随机抽样"有如下两个要求:
用简单随机抽样方法得到的样本称为简单随机样本,也简称样本。除非特别指明,本书中的样本皆为简单随机样本。于是,样本 可以看成是相互独立的具有同一分布的随机变量,又称为 i.i.d.(独立同分布,independently identically distributed)样本,其共同分布即为总体分布。
设总体 具有分布函数 , 为取自该总体的容量为 的样本,则样本联合分布函数为
对无限总体,代表性与独立性容易实现,关键在于排除有意或无意的人为干扰。对有限总体,只要总体所含个体数很大,特别是与样本量相比很大,则独立性也可基本得到满足。
还没有评论,来说第一句话吧