网站配置/电商培训机构需要什么资质
方差分析法是数据分析过程中最常用的统计分析方法之一,主要用于比较三个或三个以上的总体均值是否有显著差异。方差分析的原假设为:各总体均值全相等,拒绝原假设后,得到的结论将是:各总体均值不完全相等,说明可能全部总体均值之间都存在差异,也有可能仅部分总体均值之间有差异。
那到底是哪些组均值之间有明显差异呢?这需要我们继续进行组与组之间的两两比较。两两比较的方法有很多种,常用的方法包括:S-N-K法、LSD法和Duncun法等,它们的选用原则是:
1、如果需要将组间较小的差异找出,就用S-N-K法;2、如果只有当组间差异足够大时,才认为有差异,就选用LSD法; 3、如果要求介于两种方法之间,则选用Duncun法。
一般情况下,这些方法得到的结果是相同的,下面的案例中我们将使用Duncun法来进行演示。
得到分析结果后,需要将数据分析结果进行整合,使结果明白易懂,且符合学术规范。此时,我们常使用字母来标记组间的显著性差异,这种方法被称为标记字母法。下面,我将用一个完整的案例向大家演示如何用标记字母法进行多组样本间的差异显著性分析。
1.案例数据
案例数据中记录了8种水稻品种的产量,每个品种有6株水稻。想要比较这8个不同品种的水稻产量是否有显著差异?
2.数据分析过程
第一步:正态性检验
探索因变量【产量】的分布情况,初步确定数据是否可以进行方差分析;
选择分析 描述统计 探索,将【产量】选入因变量列表,点击确定,得到因变量正态性检验结果如下:
如上表所示,因变量正态性检验的显著性P值大于0.05,说明因变量【产量】的数据满足正态分布。
第二步:方差同质性检验
进行方差同质性检验,确定不同总体的方差齐性;如果数据不满足方差齐性检验的结果,则不适合直接采用方差分析方法,而需要改用非参数检验的方法。这一步在SPSS中可与后续差异分析步骤同时进行,在此略。
第三步:对数据进行差异分析和多重比较
选择分析 比较平均值 单因素ANOVA检验,在对话框中,将【品种】选入因子,将【产量】选入因变量列表;
在事后比较子对话框选择进行组间两两比较的方法:勾选邓肯(Duncun法);
在选项子对话框:勾选方差齐性检验;
点击确定,得到分析结果如下图:
3.简要的结果分析
上图中方差齐性检验的显著性P值大于0.05,说明数据满足方差齐性,可以用方差分析方法对数据进行差异分析。
单因素ANOVA检验的显著性P值小于0.05,应该要拒绝原假设(不同水稻品种的产量没有显著差异),接受备择假设,认为在95%的置信区间内,8个不同品种的水稻产量存在显著差异。
那不同水稻品种间具体存在怎样的差异呢?最下方的事后检验表格将不同水稻品种的平均产量进行从小到大的升序排列,并将不同的水稻品种归为了5个不同组别。
4.字母标注法
以上得到的分析结果非常的明了清晰,但不够简洁,我们通常不需要汇报所有的数据分析结果,而是需要删繁就简、提取出重要的关键信息。因此,如果我们的分析结果要用于学术发表或对外展示,还需要调整统计分析结果的呈现形式,以便得到更简洁直观的结果。
例如,上述的分析结果通过在Excel和Word中进行删减和格式调整后,可以用下面这一个表格来标明这8个水稻品种间的产量差异。
上图中记录了8个水稻品种的平均产量和标准差,并以均值为标准对品种进行了从大到小的降序排列,然后再根据事后两两比较的结果对品种进行字母标注。
标记字母法标记法则:凡是存在相同字母的组别之间都不存在显著差异,字母完全不同的才存在显著差异。
在这个案例中每个组别都只标注了一个字母,但在有些情况下也可能被标注多个字母。在其他案例中,假如某个组别标注了a、b两个字母,说明它和其它标注a或b的所有组别之间都没有显著差异。
在本案例中,H品种的平均水稻产量最大,且与其它品种的产量之间存在显著差异,所以被单独标注为a;F品种的平均水稻产量次之,且与其它所有品种的产量之间存在显著差异,所以被单独标注为b;A品种、G品种和B品种的平均水稻产量之间不存在显著差异,所以被归为一组,标注为c;紧接着,D品种与其它品种的平均水稻产量之间也存在显著差异,所以被单独标注为d;排在最后的E品种和C品种的平均水稻产量之间不存在显著差异,所以被归为一组,标注为e。

