莱芜四大金刚是谁啊/沈阳关键词seo排名
1.假设检验
1.1 假设检验的流程
我们给出关于某问题的一个假设,收集与这个问题相关的数据,看看这些数据是否支持我们的观点
假设检验的步骤:
(1)Set the Hypothesis(设立假设)
(2)Set the Significance Level, Criteria for a decision(为决定设立置信水平,标准)
(3)Compute the test statistics(计算检验统计量)
(4)Make a decision(做出决定,是拒绝原假设还是接受原假设)
以调查人口为例的假设检验步骤
1.2 步骤一:原假设与备择假设
以某饭店服务时间为例,某店声称每个订单平均时间 μ=45\mu=45μ=45s,有一天你又去了这个店,在 20 个订单样本中,你发现平均服务时间是 48 秒,标准差是 8 秒. 鉴于这些数据你相信这个店的说法吗?
原假设:(Null Hypothesis)H0:μ≤45H_0:\mu \leq 45H0:μ≤45
备择假设:(Alternative Hypothesis)H1:μ>45H_1:\mu \gt 45H1:μ>45
1.3 步骤二:显著性水平(α\alphaα水平)
置信水平 1−α1-\alpha1−α、显著性水平 α\alphaα
个人理解:对假设多大程度上可信制定一个标准,以此判断什么时候假设可接受,什么时候假设可拒绝【注意:确定α\alphaα水平要在收集数据之前】
显著性水平描述了我们能够接受的不同结果的限度.
0.05 的 α 水平意味着, 在原假设成立的前提下, 如果从数据中观测到的结果出现的概率小于 5%, 就拒绝原假设.
图片来源:Statistics for Analytics and Data Science: Hypothesis Testing and Z-Test vs. T-Test
双侧检验
图片来源:Statistics for Analytics and Data Science: Hypothesis Testing and Z-Test vs. T-Test
单侧检验
1.4 步骤三:检验统计量
检验统计量
对假设进行检验,以便做出接受还是拒绝原假设的决定
z-统计量、t-统计量
计算出的检验统计量为横轴上的某个值,观察这个统计量落在拒绝域还是接受域
如果检验统计量落在接受域,我们拒绝原假设失败,接受原假设
如果检验统计量落在拒绝域,我们拒绝原假设成功,接受备择假设
图片来源:单侧假设检验与双侧的区别是什么?
图片来源:T检验与Z检验
1.5 步骤四:p值
p值:在原假设成立的前提下,收集到已有数据的概率
p值的好处
1.我们只需要一个值就可以对假设做出决定。我们不需要计算两个不同的值,比如临界值和检验统计量
2.我们可以通过直接将其与显著性水平进行比较,来测试任何期望的显著性水平,不需要为每个显著性水平计算检验统计量和临界值了
如果 p<αp\lt \alphap<α,拒绝原假设;
如果 p>αp\gt \alphap>α,拒绝原假设失败
1.6 例子
笔记来源:Statistics for Analytics and Data Science: Hypothesis Testing and Z-Test vs. T-Test
1.6.1 单样本Z检验
假设我们需要确定女孩在考试中的平均分数是否高于600分
我们知道女生得分的标准差是100。所以,我们通过随机抽样收集了20个女孩的数据并记录了她们的分数。我们选择⍺值(显著性水平)为0.05作为假设检验的标准
由于p<α=0.05p\lt \alpha=0.05p<α=0.05,我们可以拒绝原假设,并根据我们的结果得出结论,女生平均得分高于600
上图中的p值如何得出?
上面我们已经计算出检验统计量 z=1.83z=1.83z=1.83,即上分位数为xα/2=1.83x_{\alpha/2}=1.83xα/2=1.83下分位数xα/2=−1.83x_{\alpha/2}=-1.83xα/2=−1.83,通过查找标准正态分布表中分位数对应的值可以得出p值
图片来源:如何通俗地理解分位数?
图片来源:标准正态分布表
图片来源:标准正态分布表
p=1−0.4664=0.336p=1-0.4664=0.336p=1−0.4664=0.336
如果是单侧检验的话,深蓝色部分的面积为p值
图片来源:标准正态分布表
1.6.2 双样本Z检验
假设我们想知道女生的平均分数是否比男生高10分。
我们知道女生得分的标准差是100,男生得分的标准差是90。
然后我们随机抽样收集20个女孩和20个男孩的数据,并记录他们的成绩。最后,我们选择⍺值(显著性水平)为0.05作为假设检验的标准
双样本z检验
1.6.3 单样本t检验
假设我们想确定女生在考试中的平均分数是否超过600分。
我们没有关于女孩分数的方差(或标准偏差)的信息。
为了进行t检验,我们随机收集10个女孩的成绩数据,我们选择⍺值(显著性水平)为0.05作为假设检验的标准
我们的 p>0.05p\gt 0.05p>0.05,因此我们没有拒绝零假设,也没有足够的证据来支持女生在考试中平均得分超过600的假设
1.6.4 双样本t检验
假设我们想要确定,男孩在考试中是否平均比女孩多15分。
我们没有关于女孩或男孩分数的方差(或标准偏差)的信息。进行t检验。
我们随机收集10个男孩和女孩的成绩数据。我们选择⍺值(显著性水平)为0.05作为假设检验的标准。
双样本检验
p<0.05p\lt 0.05p<0.05,所以我们可以拒绝零假设,并得出结论,平均来说,男孩比女孩在考试中多15分。