微信号:Rsq-9527

介绍:"R语言"交流讨论

ANOVA 模型拟合(一)

2016-06-03 09:53 笙戌公子

aov() 函数

    aov() 函数的语法为 aov(formula, data = dataframe) ,表一列举了表达式中可以使用的特殊符号。表一中的 y 是因变量,字母A、B、C代表因子。

表一:


表二列举了一些常见的研究设计表达式。在表9-5中,小写字母表示定量变量,大写字母表示组别因子, Subject 是对被试者独有的标识变量。

表二:


表达式中各项的顺序

    表达式中效应的顺序在两种情况下会造成影响:(a)因子不止一个,并且是非平衡设计;(b)存在协变量。出现任意一种情况时,等式右边的变量都与其他每个变量相关。此时,我们无法清晰地划分它们对因变量的影响。

例如,对于双因素方差分析,若不同处理方式中的观测数不同,那么模型 y ~ A*B 与模型 y ~B*A 的结果不同。R默认类型I(序贯型)方法计算ANOVA效应(参考补充内容“顺序很重要! ” )。第一个模型可以这样写: y ~ A + B + A:B 。R中的ANOVA表的结果将评价:

  A 对 y 的影响;

  控制 A 时,B对 y 的影响;

  控制 A 和 B 的主效应时, A 与 B 的交互效应。


    样本大小越不平衡,效应项的顺序对结果的影响越大。一般来说,越基础性的效应越需要放在表达式前面。具体来讲,首先是协变量,然后是主效应,接着是双因素的交互项,再接着是三因素的交互项,以此类推。对于主效应,越基础性的变量越应放在表达式前面,因此性别要放在处理方式之前。有一个基本的准则:若研究设计不是正交的(也就是说,因子和/或协变量相关) ,一定要谨慎设置效应的顺序。car 包中的 Anova() 函数(不要与标准 anova() 函数混淆)提供了使用类型II或类型III方法的选项,而 aov() 函数使用的是类型I方法。若想使结果与其他软件(如SAS和SPSS)提供的结果保持一致,可以使用 Anova() 函数,细节可参考 help(Anova,package = "car") 。


 
R语言社区 更多文章 R与数据分析 初识R——新手上路 R语言帮助文档的获取 R包的使用 R中的数据结构 ——向量
猜您喜欢 艾瑞:8月PC视频用户5.25亿 爱奇艺、优土、腾讯分列前三 Ceph管理节点故障mds迁移到存储节点 说一说近况 【好文翻译】一份快速手册:用R代码做数据探索的11步 又一年,这 3 位前 Google 工程师就是想让 Android 和 Windows 真正的「Remix」在一起