Bearbeite stat1wise1819 und vergleiche deine Lösungen. Aus dem Kurs Statistik I an der Ludwig-Maximilians-Universität München (LMU).
Im Rahmen eines 10-km-Laufs wurden für zwölf Läufer folgende Daten erhoben:
Geschlecht
Trainingsaufwand
Zeit (in min)
1
weiblich
hoch
52,16
2
männlich
niedrig
54,15
3
männlich
mittel
48,54
4
weiblich
hoch
55,63
5
männlich
hoch
40,79
6
weiblich
niedrig
57,26
7
weiblich
mittel
49,16
8
weiblich
mittel
53,65
9
männlich
hoch
47,20
10
weiblich
niedrig
50,00
11
weiblich
mittel
53,16
12
männlich
hoch
41,57
Geben Sie jeweils alle Lagemaße an, die für die Beschreibung des Merkmals „Geschlecht“ geeignet sind!
Geben Sie für diese(s) Lagemaß(e) jeweils den/die Wert(e) für die Stichprobe an.
Geeignete(s) Lagemaß(e) für „Geschlecht“:
Wert(e) des/der Lagemaße(s) für „Geschlecht:
Nennen Sie ein Zusammenhangsmaß, welches geeignet ist, um den Zusammenhang zwischen „Geschlecht“
und „Trainingsaufwand“ zu quantifizieren. Begründen Sie Ihre Entscheidung!
(Hinweis: Ohne korrekte Begründung werden hier keine Punkte vergeben.)
Geeignetes Zusammenhangsmaß (mit Begründung):
Sie gruppieren die Daten nach der Variable „Geschlecht“ und erhalten für die Variable „Zeit“ folgende Werte:
x = 50,27; weiblich = 53,00; männlich = 46,45; s = 4,96 ; Sweiblich = 2,67;
Berechnen Sie mit Hilfe dieser Angaben s2,
Berechnung von su
_/6
Smännlich = 4,90
Unterscheiden Sie im Folgenden nur noch zwischen den beiden Klassen „Schneller Lauf“ (Zeit < 50min)
und „Langsamer Lauf“ (Zeit ≥ 50min).
(i) Befüllen Sie die Kontingenztabelle für das oben beschriebene Merkmal (Langsamer/Schneller Lauf) und
den Trainingsaufwand (niedrig/mittel/hoch) inklusive Randhäufigkeiten.
Befüllen der Kontingenztabelle (inklusive Randhäufigkeiten):
Geschw. Trainingsaufw.
niedrig
Langsamer Lauf
Schneller Lauf
Σ
mittel
hoch
Σ
(ii) Berechnen und interpretieren Sie Kendalls π!
Berechnung von Kendalls :
(Hinweis: Sollten Sie zu keinem Ergebnis kommen, verwenden Sie für die Interpretation σ = 0,5.)
Interpretation von Kendalls Tb:
(iii) Nennen Sie einen Unterschied hinsichtlich der Interpretierbarkeit zwischen Zusammenhangsmaßen für
ordinale Merkmale und Zusammenhangsmaßen für nominale Merkmale.
Unterschied hinsichtlich der Interpretierbarkeit:
Gegeben sind jeweils die Preise für ein Tagesticket für einen Erwachsenen im Skigebiet A für die Winter 2004, 2010, 2014 und 2017.
Winter t
Preis Pt in EUR
2004
2010
2014
2017
38
45
45
48
Berechnen Sie jeweils für jeden Winter die Preismesszahl I21004,t zur Basis 2004.
Für Skigebiet B sind für die Winter 2010, 2014, und 2017 jeweils die Preismesszahlen zur Basis 2014 gegeben.
Winter t
2010
2014
2017
I2014,t
0,933
1,000
1,111
Berechnen Sie für Skigebiet B jeweils für jeden Winter die Preismesszahl I2010,t zur Basis 2010.
In welchem der beiden Skigebiete war der Preis für ein Tagesticket im Winter 2017 niedriger? Nehmen Sie hierzu an, dass man im Winter 2010 in beiden Skigebieten denselben Preis p2010 zahlte.
(Hinweis: Ohne korrekte Begründung/Berechnung werden hier keine Punkte vergeben.)
Antwort mit Begründung/Berechnung:
Ein Sportverein führte in den Jahren 2014 und 2017 einen 1-Tages-Skiausflug durch. Die folgende Tabelle zeigt, wie viele Erwachsene, Jugendliche und Kinder an diesem Ausflug jeweils teilnahmen, sowie die Preise für die Tagesskipässe in den entsprechenden Kategorien.
Jahr
2014
2017
Anzahl Erwachsene
15
11
Preis Erwachsene
45 EUR
48 EUR
Anzahl Jugendliche
14
12
Preis Jugendliche
30 EUR
32 EUR
Anzahl Kinder
13
25 EUR
24 EUR
Bestimmen Sie den Preisindex nach Laspeyres für das Berichtsjahr 2017 zum Basisjahr 2014 und interpretieren Sie diesen.
Berechnung von P2014,2017:
Interpretation von P2014,2017:
Im Winter 2018 wollen 12 Erwachsene sowie 27 Kinder und Jugendliche an dem Ausflug teilnehmen, allerdings wurde 2018 das Preissystem des Skigebiets geändert.
Es gibt jetzt nur noch zwei Preiskategorien:
Erwachsene: 50 EUR;
Jugend (Kinder + Jugendliche): 30 EUR.
Berechnen Sie unter der Annahme, dass der Anteil der Kinder an Jugend derselbe wie in 2014 ist, den Preisindex nach Paasche für das Berichtsjahr 2018 zum Basisjahr 2014.
Berechnung von P2014,2018
Die folgende Tabelle zeigt die Anzahl der Dreipunktewürfe pro Spiel von 10 Basketballspielern in Abhängigkeit von ihrer Körpergröße (in Metern):
Körpergröße (m) | Dreipunktewürfe pro Spiel |
---|---|
1,98 | 2 |
2,03 | 3 |
2,06 | 4 |
2,08 | 3 |
2,10 | 4 |
2,11 | 5 |
2,13 | 4 |
2,15 | 5 |
2,18 | 6 |
2,21 | 7 |
a) Bestimmen Sie die Regressionsgerade, die die Anzahl der Dreipunktewürfe pro Spiel in Abhängigkeit von der Körpergröße beschreibt. Geben Sie die Gleichung der Regressionsgeraden an. [4 Punkte]
Gleichung der Regressionsgeraden:
Bestimmen Sie die Regressionsgerade, die die Anzahl der Dreipunktewürfe pro Spiel in Abhängigkeit von der Körpergröße beschreibt. Geben Sie die Gleichung der Regressionsgeraden an.
Welcher Anteil der Gesamtstreuung in Y wird durch das Modell erklärt?
Nehmen Sie an, alle Spieler hätten im Schnitt einen Dreipunktewurf weniger pro Spiel geworfen. Welcher
Regressionskoeffizient ändert sich dadurch? Geben Sie den neuen Wert des Koeffizienten an. [2 Punkte]
(Hinweis: Sollten Sie bei Aufgabe a) zu keiner Lösung kommen, verwenden Sie a^ = 45 und -0,2.)
Geänderter Regressionskoeffizient:
Einer der beobachteten Basketballspieler ist 2,13 m groß.
(i) Wie viele Dreipunktewürfe hätte er, dem in a) berechneten Modell nach, durchschnittlich pro Spiel
geworfen?
[1 Punkt]
(Hinweis: Sollten Sie bei Aufgabe a) zu keiner Lösung kommen, verwenden Sie a^ = 45 und b = −0, 2.)
Berechnung von y^:
(ii) In Wahrheit wirft dieser Spieler mit der Größe 2,13 m durchschnittlich 3,5 Dreipunktewürfe pro Spiel.
Berechnen Sie das Residuum für diese Beobachtung.
[1 Punkt]
Residuum:
Erwarten Sie, dass alle Residuen dasselbe Vorzeichen haben? Begründen Sie Ihre Antwort!
[1 Punkt]
Antwort (mit Begründung):
In einer Gemeinde A gibt es 20 Unternehmen, welche zusammen einen Gesamtumsatz von 2 Mio. EUR pro
Jahr erzielen. Die 10 kleinsten Unternehmen sind Schreibwarenläden, welche 10% des Gesamtumsatzes erzielen.
Zudem gibt es noch 5 Bäcker, welche zusammen 250.000 EUR Umsatz erzielen und 4 Apotheken, die 500.000
EUR umsetzen. Das Unternehmen mit dem höchsten Umsatz ist ein Supermarkt.
Vervollständigen Sie die untenstehende Tabelle.
i
Anzahl der
Unternehmen nj
Gesamtumsatz
der Gruppe i
Ui
vi
1
2
3
4
Berechnen Sie den Gini-Koeffizienten für Gemeinde A.
Berechnung des Gini-Koeffizienten für Gemeinde A:
Interpretieren Sie das Ergebnis.
(Hinweis: Sollten Sie bei b) zu keinem Ergebnis kommen, können Sie GA = 0,65 verwenden.)
Interpretation:
Für die Umsatzverteilung der 6 Unternehmen aus einer benachbarten Gemeinde B erhalten Sie einen Wert
von GB 0,6. Machen Sie die beiden Werte GA und GB durch Rechnung miteinander vergleichbar und
vergleichen Sie diese.
=
Vergleich der beiden Gini-Koeffizienten:
Für 10 Spieler der nordamerikanischen Profibasketballliga NBA zeigt die folgende Tabelle ihre Körpergröße in Zentimetern (X) sowie die durchschnittliche Anzahl der Dreipunktewürfe pro Spiel (Y).
Sie möchten die durchschnittliche Anzahl der Dreipunktewürfe pro Spiel durch die Körpergröße mittels einer linearen Regression erklären.
(Verständnishinweis: Größere Spieler spielen typischerweise näher am Korb und werfen deshalb tendenziell weniger Dreipunktewürfe als kleinere Spieler.)
(Quelle: www.basketball-reference.com; Stand: 20.12.2018)
i
Xi
Yi
1
190
7,9
2
201
6,9
3
193
4,8
4
190
4,8
5
208
1,2
6
203
4,2
7
208
1,2
8
211
1,7
9
206
4,8
10
213
3,5
Für die weiteren Aufgabenteile stehen Ihnen folgende Werte zur Verfügung:
∑i=110xi=2023;∑i=110yi=41;∑i=110xi⋅yi=8171,1;∑i=110xi2=409913;∑i=110yi2=214,8
Berechnen Sie die beiden Regressionskoeffizienten und interpretieren Sie diese.
Berechnung der Regressionskoeffizienten a^ und b^:
(Hinweis: Sollten Sie zu keinem Ergebnis kommen, verwenden Sie für die Interpretation a^=45 und b^=−0,2.)
Interpretation der Regressionskoeffizienten a^ und b^:
Nennen Sie zwei der, in der Vorlesung und Übung besprochenen, charakteristischen Eigenschaften der em-
pirischen Verteilungsfunktion.
[1 Punkt]
Zwei charakteristische Eigenschaften der empirischen Verteilungsfunktion:
Beschreiben Sie mit Worten, wie der Median definiert ist.
[1 Punkt]
Definition des Medians:
Welche Verbindung besteht zwischen empirischer Verteilungsfunktion und Median?
Verbindung zwischen empirischer Verteilungsfunktion und Median:
Wie unterscheiden sich Säulen- und Balkendiagramm von einem Histogramm?
[2 Punkte]