当前位置: 首页 > news >正文

工艺宣传网站建设/百度云盘资源共享链接群组链接

工艺宣传网站建设,百度云盘资源共享链接群组链接,留学生做留服证明在哪个网站,做网投网站卡方检验 (Chi-square test / Chi-square goodness-of-fit test) 1. 什么是卡方检验 卡方检验是一种以χ2\chi^2χ2分布为基础的用途广泛的假设检验方法。是一种非参数检验方法。它的无效假设H0H_0H0​为:观察频数与期望频数没有显著性差异。 2. 独立性…

卡方检验 (Chi-square test / Chi-square goodness-of-fit test)


1. 什么是卡方检验

卡方检验是一种以χ2\chi^2χ2分布为基础的用途广泛的假设检验方法。是一种非参数检验方法。它的无效假设H0H_0H0为:观察频数与期望频数没有显著性差异。

2. 独立性检验 (Independence)

A test of independence assesses whether unpaired observations on two variables, expressed in a contingency table, are independent of each other

独立性检验评估的是,在一个列联表中,不成对的观测对象中的两个变量是不是相互独立的

以下面的表格为例,我们来探究喝牛奶对感冒发病率有没有影响:

实际值感冒人数未感冒人数合计感冒率
喝牛奶组439613930.94%
不喝牛奶组288411225.00%
合计7118025128.29%

2.1 期望值计算

根据无效假设H0H_0H0,我们假设喝不喝牛奶和感冒与否并没有显著性关系,则人群的感冒率为:
43+2843+28+96+84=28.29%\frac{43 + 28}{43+28+96+84} = 28.29\% 43+28+96+8443+28=28.29%
则对于上述的实验对象,我们能够得到每个格中的期望值

期望值感冒人数未感冒人数合计感冒率
喝牛奶组139 * (1-0.2829)139*0.282913928.29%
不喝牛奶组112*(1-0.2829)112*0.282911228.29%
合计7118025128.29%

卡方检验就是用来比较实际值与期望值是不是有显著性差异的。如果没有,证明控制变量(喝不喝牛奶)是不会影响因变量(感不感冒)的;有显著性差异,就证明就关系。

2.2 卡方值计算

χ2=∑(A−E)2E=∑i=1k(Ai−npi)2npi(1)\chi^2 = \sum\frac{(A-E)^2}{E} = \sum_{i=1}^k\frac{(A_i-np_i)^2}{np_i} \tag{1} χ2=E(AE)2=i=1knpi(Ainpi)2(1)

其中,AiA_iAi为单元格iii中的观察值,pip_ipi为单元格iii中的在H0H_0H0假设前提下的概率,kkk为单元格数。

上例中χ2=1.077\chi^2 = 1.077χ2=1.077

2.3 H0H_0H0假设拒绝与接受

根据得到的χ2\chi^2χ2值,还并不能直接到的p-value。因为卡方分布根据其自由度有所不同,如下图所示:

在这里插入图片描述

卡方分布的概率密度函数如下:
f(x;k)={x(k/2−1)e−x/22k/2Γ(k2),x>00,otherwise(2)f(x; k) = \begin{cases} \frac{x^{(k/2-1)}e^{-x/2}}{2^{k/2}\Gamma(\frac{k}{2})}, &\ x > 0\\ 0,&otherwise \end{cases}\tag{2} f(x;k)={2k/2Γ(2k)x(k/21)ex/2,0, x>0otherwise(2)
其中kkk为自由度。

所以,首先需要计算所研究样本的自由度
k=(R−1)(C−1)(3)k = (R -1)(C-1)\tag{3}k=(R1)(C1)(3)
其中RRR为单元格的行数,CCC为单元格的列数。
上述例子中,自由度k=(2−1)(2−1)=1k = (2-1)(2-1) = 1k=(21)(21)=1

根据所给定的自由度kkk以及χ2\chi^2χ2值,即可计算p-value。

对于得到的p-value,与自己指定的显著性水平作比较(通常将0.05作为显著性水平),如果得到的p-value小于0.05,那我们认为样本所表现出来的结果是小概率事件,则我们有理由拒绝原假设H0H_0H0;否则,我们需要接受原假设H0H_0H0

通常情况下,也可以通过查表得形式来选择接受或者拒绝原假设。
如下表:
在这里插入图片描述
我们看到,χ2\chi^2χ2分布在自由度k=1k=1k=1p=0.05p=0.05p=0.05时的取值为3.84。我们得到的χ2\chi^2χ2值1.077,小于3.84,且接近于p=0.3p=0.3p=0.3时的χ2\chi^2χ2值1.07,故不能拒绝原假设H0H_0H0


3 适合度检验 (Goodness of fit)

A test of goodness of fit establishes whether an observed frequency distribution differs from a theoretical distribution

适合度检验展示了一个观察到的频率分布是否与一个理论分布不同。

以掷骰子为例,下表为投掷120次六面骰子的实际观察值:

点数观察值
118
219
323
420
516
624

3.1 期望值

我们知道,在正常情况下,掷骰子服从二项分布X∼B(n,p)X\sim B(n, p)XB(n,p),其数学期望E[X]=npE[X]=npE[X]=np,方差为Var[X]=np(1−p)Var[X] = np(1-p)Var[X]=np(1p)

在进行适合度检验时,我们的原假设H0H_0H0为观察到的掷骰子结果符合理论上的二项分布(Binomial distribution)。那么,我们就能得到掷骰子的理论值如下表:

点数观察值
120
220
320
420
520
620

3.2 χ2\chi^2χ2值计算

根据公式(1),我们得到
χ2=2.3\chi^2 = 2.3χ2=2.3

3.3 自由度确定

对于适合度检验,自由度的计算按照以下公式:
k=C−Mk = C - M k=CM
其中,CCC为我们观察到的类别数,此例中为6;MMM为我们要比较的理论分布的参数的个数,此例中为1;因此k=5k = 5k=5

3.4 H0H_0H0假设接受与拒绝

通过根据公式(2)或者查表我们能够得到,统计量χ2=2.3\chi^2 = 2.3χ2=2.3所对应的p-value大约为0.8,与显著性水平0.05相差甚远,故我们应该接受原假设H0H_0H0.

http://www.lbrq.cn/news/98893.html

相关文章:

  • 怎么做网站服务/网站推广费用
  • 网站建设 找客户/seo全国最好的公司
  • 山东网站建设团队/网站平台做推广
  • 做交友网站多少钱/百度快速排名 搜
  • wordpress怎样添加备案/图片优化软件
  • 开发网站价格/手机如何制作网站教程
  • 什么网站做h5好/东营百度推广电话
  • 好看的网站推荐一下/厦门seo培训学校
  • 做网站一定要效果图吗/网络营销推广8种方法
  • 网站建设价格西安/大连做优化网站哪家好
  • 网站后台用java怎么做/网络公司推广方案
  • 网站么做淘宝客赚佣金/宁波seo哪家好快速推广
  • 做汽车网站开题报告的意义/无锡seo公司
  • 怎么查网站的浏览量/uc浏览器关键词排名优化
  • 做网站用的编程工具/石景山区百科seo
  • 文具网站建设规划书/黄页大全
  • 专做海报设计的网站/百度客户服务电话是多少
  • 中国建设人才网信息网站/电商网站seo
  • 河南安阳疫情最新消息/被逆冬seo课程欺骗了
  • 举报网站建设自查报告/如何搭建企业网站
  • 汕尾东莞网站建设/种子搜索在线 引擎
  • 毕节网站建设/百度推广总部客服投诉电话
  • 镇江网站建设联系思创/上海自动seo
  • 部队网站建设多少钱/郑州网站推广哪家专业
  • 衡水网站设计/成都seo优化排名推广
  • 网站后台管理系统源代码/知名网站
  • 做网站 视频/app优化网站
  • 做二手手机的网站有哪些/百度搜索数据查询
  • 网站大数据怎么做的/网络营销的四大基础理论
  • 旅社网站建设/网上培训机构
  • Unreal Engine Class System
  • k8s 简介及部署方法以及各方面应用
  • IntelliJ IDEA 常用快捷键笔记(Windows)
  • MySQL编程开发(了解)
  • Mokker AI:一键更换照片背景的AI神器
  • 利用DeepSeek编写调用系统命令用正则表达式替换文件中文本的程序