Multivariate Statistik - Aufgabe 3 - Multivariate Anova

From StatWiki
Jump to: navigation, search

Beispiel 1

Man konstruiere einen Datensatz mit 2 stetigen Variablen und einer Gruppenvariable mit 3 Ausprägungen und 10 Beobachtungen pro Gruppe (also eine 15x3-Tabelle), bei dem beiden univariaten Varianzanalysen nicht signifikant sind, die multivariate jedoch schon (jeweils %5=α), und zwar so, dass die stetigen Variablen eine Korrelation von

  1. rXY=0,9 bzw.
  2. rXY=0,3
  3. rXY=0

aufweisen.

<Rworkspace> set.seed(123) groupData = function(mu,sd=1) { as.vector(sapply(mu, function(mu) { rnorm(10, mu, sd) })) } g=c(rep(1,10),rep(2,10),rep(3,10)) x=groupData(c(1,1.2,1.4))

library(foreign) sids = read.spss(paste(rfiles,"MANOVA_Diskriminanzanalyse_SIDS.raw",sep="/"),to.data.frame=TRUE) iris = read.spss(paste(rfiles,"iris.sav",sep="/"),to.data.frame=TRUE) </Rworkspace>

Beispiel 1.1

 \Sigma = 
\begin{pmatrix} \sigma_1^2  		                & \sigma_1 \cdot \sigma_2 \cdot 0.9 \\
                \sigma_1 \cdot \sigma_2 \cdot 0.9	& \sigma_2^2
\end{pmatrix}


\begin{pmatrix}
\sigma_1 & 0 \\
0 & \sigma_2
\end{pmatrix}
\cdot R \cdot
\begin{pmatrix}
\sigma_1 & 0 \\
0 & \sigma_2
\end{pmatrix}


\rho = \frac{\mathrm{cov}(x,y)}{\sqrt{\mathrm{var}(x) \mathrm{var}(y)}}


1. Generiere Normalverteilte Beobachtungen ~N(0,1)

G1 G2 G3
X1 X2 X3
Y1 Y2 Y3

2. Generiere Bivariate Normalverteilungen mit Korrelationsmatrix

 R = \begin{pmatrix} 1 & 0.9 \\ 0.9 & 1 \end{pmatrix}

 R^{\frac{1}{2}}(\vec x,\vec y)


3. Parameter  \vec \mu_1, \vec \mu_2, \vec \mu_3

G_1: \,

 \vec \mu_1 + R^{\frac{1}{2}} \cdot (\vec x_1, \vec y_1)

 \vec \mu_2 + R^{\frac{1}{2}} \cdot (\vec x_2, \vec y_2)

 \vec \mu_3 + R^{\frac{1}{2}} \cdot (\vec x_3, \vec y_3)

Wähle  \mu_1, \mu_2, \mu_3 derart, dass Unterschiede in 1-Achse

4. Varianzanalyse signifikant, falls \frac{\mathrm{MSB}}{\mathrm{MSR}}

MSR groß, falls \sigma groß.

\cos(\alpha) = \rho \cdot \frac{\sigma y}{\sigma x}

Wähle \sigma x \, und \sigma y \, derarts, dass Unterschiede in 2. Achse signifikant

c) Geht nicht, kein Unterschied!

Engine.php: unknown attribute(s) "direct"
in

y=x+groupData(c(1.4,1.2,1), 0.3)

cat("\naov(x~g))\n") summary(aov(x~g))

cat("\naov(y~g))\n") summary(aov(y~g))

cat("\nlm(y~x))\n") summary(lm(y~x))

cat("\nmanova(m~g))\n") m=cbind(x,y) summary(manova(m~g))

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf)

y=x+groupData(c(1.4,1.2,1), 0.3) plot(y~x, col=g)

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf)

y=x+groupData(c(1.4,1.2,1), 0.3) par(mfrow=c(1,2)) boxplot(x~g,main="x~g") boxplot(y~g,main="y~g")

Beispiel 1.2

Engine.php: unknown attribute(s) "direct"
in

y=x+groupData(c(1.4,1.2,1), 1.2)

cat("\naov(x~g))\n") summary(aov(x~g))

cat("\naov(y~g))\n") summary(aov(y~g))

cat("\nlm(y~x))\n") summary(lm(y~x))

cat("\nmanova(m~g))\n") m=cbind(x,y) summary(manova(m~g))

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf)

y=x+groupData(c(1.4,1.2,1), 1.2) plot(y~x, col=g)

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf)

y=x+groupData(c(1.4,1.2,1), 1.2) par(mfrow=c(1,2)) boxplot(x~g,main="x~g") boxplot(y~g,main="y~g")

Beispiel 2

File: MANOVA_Diskriminanzanalyse_SIDS.raw. Man prüfe sowohl mit univariater Varianzanalyse (auch graphisch), als auch mit multivariater Varianzanalyse, ob Puls, Geburtgewicht, Herz-und Lungenfunktion, bzw. Gestationsalter bei Säuglingen, die dem plötzlichen Säuglingstod (SIDS) erliegen, signifikant anders sind (%5=α) als bei gesunden. Man prüfe auch die Modellvoraussetzungen für sämtliche verwendete Verfahren (Varianzhomogenität, Normalverteilung).

Die Voraussetzungen sollten eigentlich auf die einzelnen Gruppen angewendet werden.

Engine.php: unknown attribute(s) "direct"
in

shapiro.test(sids$HR) bartlett.test(HR~GROUP,data=sids) shapiro.test(sids$BW) bartlett.test(BW~GROUP,data=sids) shapiro.test(sids$FACTOR68) bartlett.test(FACTOR68~GROUP,data=sids) shapiro.test(sids$GESTAGE) bartlett.test(GESTAGE~GROUP,data=sids)

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf) boxplot(HR~GROUP,data=sids,main="HR~GROUP")

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf) boxplot(BW~GROUP,data=sids,main="BW~GROUP")

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf) boxplot(FACTOR68~GROUP,data=sids,main="FACTOR68~GROUP")

Engine.php: unknown attribute(s) "direct"
in

pdf(rpdf) boxplot(GESTAGE~GROUP,data=sids,main="GESTAGE~GROUP")

Engine.php: unknown attribute(s) "direct"
in

cat("\naov(HR~GROUP)\n") summary(aov(HR~GROUP,data=sids)) cat("\naov(BW~GROUP)\n") summary(aov(BW~GROUP,data=sids)) cat("\naov(FACTOR68~GROUP)\n") summary(aov(FACTOR68~GROUP,data=sids)) cat("\naov(GESTAGE~GROUP)\n") summary(aov(GESTAGE~GROUP,data=sids))

m=as.matrix(sids[,-1]) summary(manova(m~GROUP,data=sids))

Beispiel 3

File: iris.sav. Man prüfe mittels multivariater Varianzanalyse, ob es einen Unterschied in Kelchblatt (sepal) und Blütenblatt (petal) bei den drei verschiedenen Arten der Iris gibt (%5=α). Falls ja, prüfe man mit univariaten Varianzanalysen, wo es Unterschiede gibt (in welchen Variablen bzw. zwischen welchen Gruppen) und stelle Unterschiede auch grafisch dar. Die Voraussetzungen der verwendeten Verfahren sind ebenfalls zu prüfen.

Vorraussetzungen nicht gegeben.

Daher Nicht-Parametrische Statistiken verwenden (z.b. Kurskal-Wallis). Das Problem bei Anova: Die Zerlegung stimmt trotzdem, aber die Annahmen für die F-Verteilungen stimmen nicht mehr und daher eine falsche Aussage liefern.

Engine.php: unknown attribute(s) "direct"
in

shapiro.test(iris$SEP_LEN) bartlett.test(SEP_LEN~SPECIES,data=iris) shapiro.test(iris$SEP_WID) bartlett.test(SEP_WID~SPECIES,data=iris) shapiro.test(iris$PET_LEN) bartlett.test(PET_LEN~SPECIES,data=iris) shapiro.test(iris$PET_WID) bartlett.test(PET_WID~SPECIES,data=iris)

m=as.matrix(iris[,-5]) summary(manova(m~SPECIES,data=iris))

cat("\naov(SEP_LEN~SPECIES)\n") summary(aov(SEP_LEN~SPECIES,data=iris)) cat("\naov(SEP_WID~SPECIES)\n") summary(aov(SEP_WID~SPECIES,data=iris)) cat("\naov(PET_LEN~SPECIES)\n") summary(aov(PET_LEN~SPECIES,data=iris)) cat("\naov(PET_WID~SPECIES)\n") summary(aov(PET_WID~SPECIES,data=iris))