抽样误差与标准误、t分布、参数估计、假设检验因为总体抽样,然后用样本估计总体肯定会产生误差
这样用标准误这个指标来衡量这个抽样误差。总体数据呈现各种各样的特征
于是有各种分布来描述它们的分布,知道了分布就可以估计这个抽样误差
参数估计是说已经知道样本的各种描述性特征了,用这些综合分布来估计总体的各项参数
估计一个数就是点估计,估计一个范围就是区间估计。假设检验是检验这个估计对不对
给出一个概率。大数定律:样本量越大,样本均值几乎必然等于均值
中心极限定理:样本量趋于无穷大的时候,多次抽样得到的样本们的均值的频次逐渐趋于正态分布。
抽样误差是指抽出的样本和总体的差异,不同的抽样方法产生的抽样误差不一样。
t分布自由度可以简单理解为样本量,当自由度趋向于无穷大时,T分布趋近于正态分布。
转化方法就是减去均值再除以标准差。这个转化又叫标准化或者Z值标准化。
这个转化也可以判断数值是不是异常,Z值绝对值大于3为异常值,大于5为极端值。