Bearbeite Altklausur und vergleiche deine Lösungen. Aus dem Kurs Mathematik und Statistik an der Justus-Liebig-Universität Gießen (JLU Gießen).
Die folgenden R-Outputs (nächste Seite) enthalten Informationen über Alter und Preis verschiedener Autos des Modells Pepino Tortuga.
Im Rahmen einer Bachelorarbeit wurde der Einfluss der Ernährungsweise auf die Cholesterinwerte untersucht. Die Cholesterinwerte in mmol/l von n1=9 sich vegan ernährenden Studenten und n2=10 sich omnivor ernährenden Studenten wurden erhoben. Die in Statistik unerfahrene Bachelorstudentin, die die Daten auswertet, hat alle möglichen Tests in R gerechnet:
epic <- data.frame( +chol=c(3.98, 4.13, 4.50, 4.80, 4.99, 5.03, 5.17, 5.64, 5.87,
Varianzen:
tapply(epicchol,epicnutr, var) omnivor vegan 0.1433567 0.3994611
Output 1:
Shapiro-Wilk normality test epicchol[epicnutr == omnivor] W = 0.96195, p-value = 0.8079
Output 2:
Shapiro-Wilk normality test epicchol[epicnutr == vegan] W = 0.96588, p-value = 0.8574
Output 3:
F test to compare two variances data: epic chol by epic$ nutr F = ?????, num df = 9, denom df = 8, p-value = 0.1481 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.08236308 1.47208997 sample estimates: ratio of variances 0.3588752
Kultur <- c(Weizen, Roggen, Gerste, Hafer, Kartoffeln, Rüben, Sonstige)
fuenfzig <- c(9.7, 15.7, 7.6, 18.6, 15.6, 7.3, 23.5)
siebzig <- c(20.7, 6.3, 15.3, 8.2, 22.9, 15.2, 9.4)
Der Polyphenolgehalt von Weinen in g/l wurde in Abhängigkeit von Sorte und Gärungsart untersucht. Die folgenden Outputs liefern einen Überblick über den Datensatz.
levels (polygaerung)[1]maischesaftlevels(polysorte) [1] 1 2 3 4 5 6 xtabs (~ gaerung, data = poly) gaerung maischesaft 24 24 xtabs (~ sorte, data = poly) sorte 123456 8 8 8 8 8 8 xtabs (~ sorte + gaerung, data = poly) gaerung sorte maische saft 1 4 4 2 4 4 3 4 4 4 4 4 5 4 4 6 4 4
Die folgende Urliste enthält die Cholesterinwerte xi; in mg/dl von Gießener Männern im Alter von 30-44 Jahren: 153 277 163 202 172 223 238 148 169 169 162 184 176 191 196 203 228 189 150 198 267 261 254 Folgende Angaben könnten zum Rechnen hilfreich sein: Σxi=5564, Σxi2=1326700, (Σxi)2=30958096, Σ(xi−xˉ)2=136004
Berechnen Sie die Varianz V der Cholesterinwerte.
Bestimmen Sie den Median Z der Cholesterinwerte.
Berechnen Sie die Stichprobenvarianz s2 der Cholesterinwerte.
Bestimmen Sie die Anzahl k der Klassen für eine Klassenbildung der Cholesterinwerte.
Bestimmen Sie das 3. Quartil Q75% der Cholesterinwerte.
Geben Sie dasjenige Intervall an, das die größte Anzahl an Cholesterinwerten enthält.
Der Dataframe survey enthält die Daten eines kleinen Gesundheitssurveys. Eine erste Übersicht über die Daten ergab folgenden Output:
str(survey, vec.len = 8) 'data.frame': id:int950361492209119482675501 geschlecht : int 1 0 0 1 1 0 1 0 abschluss:Factorw/3levelsabi,fh,uni:13322113 diabetes : logi TRUE FALSE FALSE FALSE FALSE TRUE FALSE TRUE gewicht:num97.484.875.278.976.1116.489.669.9 cholesterin : int NA 167 222 234 154 199 206 176 $ bluthochdruck: Factor w/ 2 levels ja,nein: 2 2 1 2 2 1 2 1
Geben Sie den R-Befehl an, der eine Matrix ID mit den IDs der Personen aus dem Dataframe survey erstellt, wobei die IDs in zwei Spalten angeordnet sind und die erste Zeile die IDs 950 und 119 enthält.
Geben Sie den R-Befehl an, der die Standardabweichung der Gewichtswerte der Personen mit Diabetes berechnet.
Erstellen Sie ein Boxplot, der die Verteilung des BMI in der diabetischen und nicht-diabetischen Gruppe veranschaulicht.