全程班
632人加入学习
(0人评价)
CFTA 一级全程班(课程有效期:两年)
价格 ¥ 8800.00

推断性统计有两个分支

1. 估计 2 假设性检验

第一部分, 估计, 就是用样本来估计总体的情况

注意总体和样本的符号是不同的, 总体的参数通常用希腊字母表示,样本参数通常用英文字母表示

凡事样本抽样都是随机变量 都有一个概率分布

中心极限定理告诉我们当样本容量n>=30 且总体均值方差已知的常数的情况下,那么样本就会近似符合正态分布。而且这个样本的均值和总体的均值是一样的,样本的方差等于总体方差除于n .比如,全国人口的身高,就会复合正态分布的常数。

标准误--指样本均值的标准差

已知总体方差的情况和未知总体方差的情况分开讨论如下:

注意 在未知总体方差的情况洗, 不知道总体标准差值, 所以只能用样本标准差s 代替, s 则来自于,要注意, 样本的标准差s 和所求的样本均值的标准差是两个不同的概念。

如何用样本来估计总体的均值有两个办法。

第一种,点估计 (单次抽样-不太靠谱);

第二种,区间估计(给出一定的区间范围以及落在该范围内的概率confidence level)-比较靠谱

那么这个范围如何来确定呢?

要分为 总体的方差已知总体方差未知两种情况来讨论。

第一种,

由中心极限定理知道样本大于30的样本分布类似于正态分布,第二部,标准化成标准正态分布,即得到一个z 分布。如下:

要记住的是

1.65,1.96 代表 confidence level 90%, 95% 的概率,取值会落在该区间。

另外, 相对于90%,95% CL 剩下的10%,5%我们称之为显著性水平alpha 即下图,绿色阴影部分。

 

第二种情况 在总体方差未知的情况下

现在抽样的均值和抽样的方差两个都是随机变量,出现了不值一个随机变量的这种情况下,那么样本就不在服从正态分布了,而是服从t-分布。 

t-分布相比z -分布,它的形状是低峰肥尾的。那么t-分布的关键值就是不一样的。查t-分布表可得到。

[展开全文]

授课教师

高级讲师

课程特色

视频(80)
下载资料(2)
考试(2)