抽样单位数的多少,总体中被研究标志的变动程度的大小。
抽样误差是抽样理论的一个重要概念,在说明抽样误差之前我们先介绍统计误差。统计误差是指在统计调查中,调查资料与实际情况间的偏差。即抽样估计值与被估计的未知总体参数之差。例如,样本平均数与总体平均数之差;样本成数与总体成数之差等。在统计推断中,误差的来源是多方面的,统计误差按产生的来源分类,有登记误差和代表性误差。
登记误差又称调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。例如,由于指标含义不清,口径不同而造成的误差;由于被调查者提供不实的资料,以及在登记、计算、抄写上有差错等而出现的误差。这种登记误差不论是在抽样调查还是在其他形式的调查中都有可能产生。调查的范围越广,规模越大,内容越复杂,产生登记误差的可能性就越大。
代表性误差是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。代表性误差的发生有以下两种情况:一种是由于违反了抽样调查的随机原则。例如,有意识多选好的单位或较差的单位进行调查而造成的系统性误差。可见,只要遵循了随机原则就可以避免产生系统性误差,系统性误差和登记性误差一样,都是抽样组织工作造成的,应该采取措施预防误差发生或将其减小到最低程度;另一种情况是指遵循了随机原则,可能抽到各种不同的样本而产生的随机性误差。随机性误差在抽样推断中是不避免的,是偶然的代表性误差。
抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。由于总体平均数、总体成数是唯一确定,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是推断总体指标的依据。
抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。确定其具体的数量界限,并通过抽样设计程序加以控制,因此抽样误差也可以称为可控制的误差。