Bearbeite Klausur 19:20 und vergleiche deine Lösungen. Aus dem Kurs Mathematik und Statistik an der Justus-Liebig-Universität Gießen (JLU Gießen).
Für die Proband*Innen eines Gesundheitssurveys wurden verschiedene Variablen erhoben. Bestimmen Sie das Skalenniveau der folgenden Variablen:
Bundesland des Erstwohnsitzes (Hessen, Bayern, Baden-Württemberg, Saarland, ...)
Alter in Jahren (34 Jahre, 25 Jahre, 67 Jahre, ...)
Körpertemperatur in Grad Celsius (36.8°C, 37.0°C, 36.5°C,...)
BMI-Klasse (Untergewicht, Normalgewicht, Übergewicht, Adipositas I, Adipositas II, Adipositas III)
Die Angabe und weitere Informationen zu dieser Aufgabe finden Sie im Zusatzbogen.
Welche Antwortoption entspricht der Variationsbreite der Cholesterinwerte?
Welche Antwortoption entspricht in Rechenweg und Ergebnis dem arithmetischen Mittel der Cholesterinwerte?
Welche Antwortoption entspricht in Rechenweg und Ergebnis der Varianz der Cholesterinwerte?
Bestimmen Sie für die Cholesterinwerte das Quartil Q75% mit allen erforderlichen Rechenschritten. Welcher Wert entspricht k bei der Berechnung von Q75%?
Welche Antwortoption entspricht dem Quartil Q75% der Cholesterinwerte?
Welches der Intervalle entspricht dem 90%-Konfidenzintervall des arithmetischen Mittels der Cholesterinwerte? Eine t-Tabelle finden Sie auf der letzten Seite des Zusatzbogens.
Die Angabe und weitere Informationen zu dieser Aufgabe finden Sie im Zusatzbogen.
Man kann mit der R-Funktion sum() Summen der Dataframe-Spalten berechnen, z. B. sum(survey$id). Für wie viele Variablen im Dataframe survey ergibt die Anwendung der Funktion sum() einen Error? (Hinweis: NA # Error)
Welches Ergebnis ergibt die Eingabe sum(survey$cholesterin)?
Welcher Befehl erzeugt die Matrix ID?
Schreiben Sie alle Elemente der Variablen bluthochdruck des Dataframes survey in der richtigen Reihenfolge auf.
Welcher Befehl berechnet die Standardabweichung der Gewichtswerte der Diabetiker (diabetes == T) im Dataframe survey?
Die Angabe und weitere Informationen zu dieser Aufgabe finden Sie im Zusatzbogen.
Welche der Aussagen über die Boxplots treffen zu? Sie müssen für alle Aussagen jeweils eine Antwortoption ankreuzen, entweder ja oder nein. (ja: = trifft zu, nein = trifft nicht zu) Der BMI-Median der Diabetiker ist niedriger als der BMI-Median der Nichtdiabetiker. Die Interquartilsabstände der BMI-Werte der beiden Gruppen unterscheiden sich um weniger als 10 Einheiten. In den Boxplots sind alle Punkte als Ausreißer gekennzeichnet, die mehr als 1.7-mal 50% außerhalb der Box liegen. Es gibt KEINE Überlappung der unteren 25% der BMI-Werte der untersuchten Gruppen.
Die Angabe und weitere Informationen zu dieser Aufgabe finden Sie im Zusatzbogen.
Betrachten Sie die Outputs zu Aufgabe 5 im Zusatzbogen und berechnen Sie ggf. fehlende Maßzahlen. Welche der Gleichungen unter Punkt 5.1 entspricht der Regressionsgleichung für den Zusammenhang zwischen Alter und Preis der Autos? Beachten Sie bei der Entscheidung, welche Variable die unabhängige, und welche Variable die abhängige Variable ist.
Betrachten Sie die Outputs zu Aufgabe 5 im Zusatzbogen und berechnen Sie ggf. fehlende Maßzahlen. Welche der folgenden Aussagen zur Analyse treffen zu? Sie müssen für alle Aussagen jeweils eine Antwortoption ankreuzen, entweder ja oder nein. (ja: = trifft zu, nein = trifft nicht zu) Hier liegt Einfachbesetzung vor. Die Korrelation zwischen Preis und Alter der Autos ist positiv. Der Preis ist die unabhängige Variable. Ein nagelneuer Pepino Tortuga kostet im Mittel etwa 12400 Euro.
Betrachten Sie die Outputs zu Aufgabe 5 im Zusatzbogen und berechnen Sie ggf. fehlende Maßzahlen. Welche der folgenden Aussagen zur Analyse treffen zu? Sie müssen für alle Aussagen jeweils eine Antwortoption ankreuzen, entweder ja oder nein. (ja = trifft zu, nein = trifft nicht zu) Beschreibt man den Zusammenhang zwischen Alter und Preis durch eine Regressionsgerade, so werden ca. 81.8% der Variation des Preises durch das Alter erklärt. Es liegen signifikante Abweichungen von der Linearität vor (amax = 0.05). Der p-Wert für den Test auf Abweichungen von der Linearität ist kleiner als 2.2.10-16
Die Angabe und weitere Informationen zu dieser Aufgabe finden Sie im Zusatzbogen.
Betrachten Sie zunächst alle Outputs. Kann man für die Grundgesamtheit omnivor von Normalverteilung ausgehen?
Alle Outputs: Kann man von Varianzhomogenität der beiden Grundgesamtheiten omnivor und vegan ausgehen?
Alle Outputs: Welcher Output enstpricht unter Beachtung aller Testvoraussetzungen dem korrekten Test zur Fragestellung, ob die Veganer im Mittel niedrigere Cholesterinwerte haben als die Omnis?
Betrachten Sie ab jetzt Output 4. Was war die Nullhypothese für den durchgeführten Test?
Der R-Code zu Teilaufgabe 6.5 im Zusatzbogen soll für den Dataframe epic den Output 4 erzeugen. Kreuzen Sie den richtigen Codebaustein für Codelücke ??(1)?? an.
Der R-Code zu Teilaufgabe 6.5 im Zusatzbogen soll für den Dataframe epic den Output 4 erzeugen. Kreuzen Sie den richtigen Codebaustein für Codelücke ??(2)?? an.
Der R-Code zu Teilaufgabe 6.5 im Zusatzbogen soll für den Dataframe epic den Output 4 erzeugen. Kreuzen Sie den richtigen Codebaustein für Codelücke ??(3)?? an.
Der R-Code zu Teilaufgabe 6.5 im Zusatzbogen soll für den Dataframe epic den Output 4 erzeugen. Kreuzen Sie den richtigen Codebaustein für Codelücke ??(4)?? an.
Welcher der folgenden Werte entspricht dem Betrag der Teststatistik für Output 4?