Zum Inhalt springen

  • Beiträge
    72
  • Kommentare
    239
  • Aufrufe
    11.913

Modul: Statistik


kurtchen

972 Aufrufe

 Teilen

Bislang war ich von allen Mathematik-Modulen bei Springer Campus begeistert. An Mathe 1 "Mathematisch-logische Grundlagen der Informatik" habe ich vor allem die sehr intensive Betreuung durch meinen Tutor geschätzt. Das war gerade bei meinem ersten Mathe-Modul sehr hilfreich war. An Mathe 2 "Lineare Algebra" und "Analysis" und Mathe 3 "Angewandte Mathematik" gefielen mir die sehr guten PDF-Tools von Herrn Lenze, mit denen man sich selbst nach Bedarf Übungsaufgaben generieren konnte. Die Messlatte für das letzte Mathematik-Modul "Statistik" lag also schon ziemlich hoch. Nachdem ich diesen Kurs am letzten Freitag abgeschlossen habe, kann ich sagen: Das beste kommt zum Schluss.

 

Auf das Modul Statistik war ich... sagen wir mal gespannt. Ich gehöre ja zu denen, die Mathematik zu Schulzeiten mochten. Aber mit Statistik habe ich mich tatsächlich in der Schule nie beschäftigt. Nicht mal mit Wahrscheinlichkeitsrechnung. In der Mittelstufe legte unser Lehrer das Thema immer ans Ende des Schuljahres, weil er es für unwichtig hielt. Und Jahr für Jahr kamen wir mit dem Stoff nicht schnell genug voran, so dass es am Ende wegfiel. In der Oberstufe war in meinem Bundesland Analysis für alle Abiturienten Pflicht. Außerdem konnte wahlweise Statistik oder Lineare Algebra mit analytischer Geometrie behandelt werden. An meiner Schule wurde nur lineare Algebra angeboten. Das war natürlich eine gute Grundlage für das Modul Mathe 2. Aber was Statistik angeht, hatte ich tatsächlich nur ganz geringe Vorkenntnisse.

 

Dabei spräche vieles dafür, gerade dieses Gebiet der Mathematik im Schulunterricht zu betonen. Analysis und lineare Algebra sind wichtig in technischen und naturwissenschaftlichen Studiengängen. Statistik braucht man in Biologie und Medizin, in den Wirtschaftswissenschaften und in allen Sozialwissenschaften. Und wenn Geisteswissenschaftler überhaupt Mathematik brauchen, so ist es wohl Statistik. Wer Nachrichten schaut oder Zeitung liest, ist laufend mit Statistiken konfrontiert. Statistische Grundkenntnisse müssten eigentlich zur Allgemeinbildung gehören. Last but not least ist die Statistik der Teil der Mathematik, der sich mit dem Ungewissen und Unpräzisen beschäftigt, während die meisten anderen Gebiete der Schulmathematik den Eindruck erwecken, Mathematik handele allein vom Exakten. Ich war also sehr neugierig darauf, diese Lücke meiner Bildungsbiographie zu schließen.

 

Das Lehrbuch "Basiswissen Statistik" von Michael Müller und Werner Poguntke ist Grundlage für diesen Kurs. Es hat an die 180 Seiten, was für ein Modul bei Springer Campus sehr wenig ist. Wie schon bei den anderen mathematischen Kursen ist die Informationsdichte sehr hoch. Die 180 Seiten erfordern durchaus vergleichbar viel Arbeit wie 500 Seiten Software-Engineering. Das Buch ist aber keine reine Formel- und Beweisorgie. Anwendungsbeispiele zu allen Themen machen dieses Buch besonders lebendig und praxisnah. Man merkt, dass Statistik ein Fach ist, dass man in vielen Wissens- und Lebensbereichen brauchen kann. Während in anderen Mathematik-Modulen die Anwendungsbeispiele gelegentlich ein bisschen konstruiert wirkten, konnte man hier immer gleich den Nutzen des ganzen erkennen.

 

Wie schon beim Lehrbuch "IT-Sicherheit" hat Herr Poguntke auch hier viele Verweise innerhalb des Buches eingebaut. Er verweist auf künftige Kapitel, in denen ein aktuell behandeltes Thema noch einmal relevant werden wird. Und er verweist auf vorangegangene Kapitel, in denen man Grundlagen für den aktuellen Stoff noch einmal nachlesen kann. Das hat mir sehr geholfen, die Bezüge zwischen den Kursthemen zu erkennen und den Stoff im Zusammenhang zu denken. Darum bin ich der Meinung, "Basiswissen Statistik" ist das beste unter den guten Mathematik-Lehrbüchern im Studiengang.

 

Lehrbuch, Online-Tests und Übungsaufgaben sind in diesem Modul besonders gut aufeinander abgestimmt. Es gibt Übungsaufgaben zu allen Themen des Kurses. PDF-Tools, mit denen man sich selbst neue Aufgaben generieren kann, gibt es in diesem Kurs leider nicht. Ich habe aber festgestellt, dass das Übungsmaterial genügt, um sich gut auf die Prüfung vorzubereiten.

 

Der Kurs zerfällt im wesentlichen in zwei Teile:
- deskriptive Statistik
- induktive Statistik

 

Der Unterschied ist folgender: In der deskriptiven Statistik habe ich eine vollständige Sammlung von Daten oder Werten, die ich verdichten möchte, um eine allgemeine Aussage zu treffen. Aus dem Alltag geläufig ist zum Beispiel der Durchschnitt, der in der deskriptiven Statistik Mittelwert heißt. Er fasst zum Beispiel alle Noten eines Studium in einem Wert zusammen.


In der induktiven Statistik habe ich eine Stichprobe, von der ich auf eine Gesamtmenge schließen möchte. Es gibt Millionen Wahlberechtigte Bürger, aber befragt habe ich nur ein paar Tausend. Nun möchte ich eine Prognose abgeben, wie die Wahl ausfallen wird und ich möchte abschätzen können, mit welcher Wahrscheinlichkeit meine Prognose zutrifft. Kennzeichnend für die induktive Statistik ist also, dass...
... mir ein großer Teil der relevanten Daten unbekannt ist.
... ich wahrscheinlichkeitstheoretische Überlegungen anstellen muss.

 

Themen in der deskriptiven Statistik sind:
- Lage- und Streuungsmaße
- Graphische Darstellungen von Häufigkeiten
- Konzentration und Disparität
- Lorenzkurve
- Konzentrationskoeffizient nach Gini
- Messzahlen und Indizes
- Geometrisches Mittel
- Zusammenhangsanalyse
- Kreuztabellen
- Unabhängigkeit und Kontingenzmaße
- der Korrelationskoeffizient nach Pearson und nach Spearman
- Lineare Regression
- Zeitreihenanalyse

 

Die Themen sind sehr lebensnah präsentiert. Mathematisch ist relativ leicht nachzuvollziehen, was hier geschieht. Dieser Teil des Kurses ist vergleichsweise einfacher. Wer sich mit Mathematik schwer tut, sollte sich auf diesen Teil konzentrieren, weil man hiermit in der Klausur einen guten Punktesockel aufbauen kann, so dass man zumindest nicht durchfällt.

 

Die induktive Statistik ist ein bisschen schwieriger und mathematisch raffinierter. Im Grunde wird die Sache in drei Schritten aufgebaut:
1. Die Kombinatorik handelt davon, auf wieviele Arten man aus Mengen etwas auswählen kann. Ein aus dem Alltag bekanntes Beispiel ist die Ziehung von 6 Lottozahlen aus 49.
2. Die Wahrscheinlichkeitsrechnung weist auf dieser Grundlage bestimmten Ereignissen und Kombinationen von Ereignissen eine Zahl zwischen 0 und 1 zu, die man Wahrscheinlichkeit nennt. Was genau eine Wahrscheinlichkeit ist, bleibt letztlich eine philosophische Frage. (Psychologisch interessant ist, dass man beim Umgang mit Wahrscheinlichkeiten leicht in gewisse "kognitive Tunnel" rennt. Das sind Irrwege des Denkens, die einem zeigen, dass man leider gerade im praktisch relevanten Gebiet der Wahrscheinlichkeitsrechnung nicht gut beraten ist, auf Intuition zu setzen. Die Autoren präsentieren in diesem Zusammenhang ein paar interessante Paradoxien, z.B. das Simpson Paradox. Dieses wird im Lehrbuch anhand von zwei Gruppen präsentiert, in denen der Anteil der nichtrauchenden Männer höher ist als der der nichtrauchenden Frauen. Vereint man diese beiden Gruppen zu einer, so ist der Anteil nichtrauchender Frauen höher. Das überrascht und verwirrt, auch wenn man alles wiederholt nachrechnet.)
3. Auf der Grundlage von Kombinatorik und Wahrscheinlichkeitsrechnung beschäftigt man sich nun mit verschiedenen Wahrscheinlichkeitsverteilungen, von denen die bekannteste die Standard-Normalverteilung ist. Sie ist auch als Glockenkurve bekannt. Normalverteilungen sind deshalb so nützlich, weil dort, wo sich viele zufällige Phänomene überlagern, regelmäßig eine Normalverteilung zu beobachten ist.

 

Themen in der induktiven Statistik sind:
- Kombinatorik
- Rechnen mit Wahrscheinlichkeiten
- Bedingte Wahrscheinlichkeiten
- Kontingenztabellen und Wahrscheinlichkeitsbäume
- die Bayes-Formel
- Gemeinsame Wahrscheinlichkeiten
- Zufallsvariablen
- Bernoulli-Verteilung
- Binomial-Verteilung
- Hypergeometrische Verteilung
- Poisson-Verteilung
- Stetige Verteilungen
- Exponential-Verteilung
- Normalverteilung
- t-Verteilung
- zentraler Grenzwertsatz
- Approximation mit der Normalverteilung
- Schätzen und Testen
- Schätzung unbekannter Parameter
- Testverfahren

 

Es folgt ein knappes Kapitel über Statistik mit Rechnern, das aber nicht klausurrelevant ist. In diesem Kurs lernt man, Statistik sozusagen mit Papier und Bleistift zu treiben. Dabei merkt man durchaus, dass viel mechanische Rechenarbeit anfällt. Aus diesem Grund darf in der Klausur ein nicht-programmierbarer Taschenrechner verwendet werden. Wer einmal erlebt hat, wie viel Mühe es macht, eine größere Menge von Messwerten zu verdichten, der kommt schnell auf die Idee, das man das mit Software automatisieren müsste. Das ist allerdings nicht mehr Thema dieses Moduls.

 

Die Betreuung durch meinen Tutor war auch in diesem Mathematik-Modul hervorragend. Die Rückmeldungen kamen schnell. Spannend wurde es gerade dann, wenn ich nicht alles richtig hatte. Hier gab es dann Anregungen, wie man doch noch selbst auf die richtige Lösung kommen konnte. Einmal bin ich in einen der besagten kognitiven Tunnel getappt, so dass ich alles richtig gerechnet und am Ende doch die falschen Schlüsse gezogen habe. Das war ein recht witziger Austausch, bis bei mir endlich der Groschen fiel. (Kurz gesagt, bin ich auf eine Variante des bekannten "Ziegenproblems" reingefallen. Wer das nicht kennt, einfach mal googlen.)

 

Der Online-Test und die Online-Klausur waren beide gut machbar, wenn man seine "Hausaufgaben" erledigt hatte. Hier konnte man sich noch mal ein kleines Bonuspunktepolster für die Klausur erarbeiten. Geschenkt bekommt man es aber nicht. Die Online-Klausur gibt einen realistischen Vorgeschmack auf das Niveau der Präsenzklausur. Schwierig für mich war: Mein gewohnter Taschenrechner ist programmierbar und funktioniert mit RPN-Logik. Für die Klausur musste ich mir den Taschenrechner meiner Tochter ausleihen. Es hat mich tatsächlich ausgebremst, ständig suchen zu müssen, wo welche Taste ist. Mal schauen, wie verheerend sich das ausgewirkt hat. Unterm Strich ist das aber eine faire Klausur, die die Themen des Kurses breit abdeckt. Man hat ein bisschen Zeitdruck, kann aber alles schaffen, wenn man ordentlich vorbereitet ist.

 

Damit wäre nun der Studienbereich Mathematik abgeschlossen. Was mir jetzt noch gefallen würde, wäre ein aufbauendes Modul zur Statistik mit Rechnern. Ich denke zum Beispiel an Datenanalyse mit R oder Statistik-Programmierung mit Python. (Da gibt es ein tolles Buch von Allen B. Downey.) Auch ein Modul zur Datenvisualisierung fände ich für einen Studiengang Web- und Medieninformatik ziemlich cool. Gibt es leider bislang nicht, aber ein paar Wünsche dürfen ja noch offen bleiben.

 Teilen

8 Kommentare


Empfohlene Kommentare

SebastianL

Geschrieben

Statistik hab ich nie richtig gemocht. Du hast mein Beileid dafür.:2_grimacing:

Link zu diesem Kommentar
  • Community Manager
Markus Jung

Geschrieben

Habt ihr in dem Kurs gar nicht mit Statistik-Tools wie R oder SPSS gearbeitet?

Link zu diesem Kommentar

Nein, leider nicht. Grundsätzlich finde ich es schon gut, dass es in diesem Modul erst mal darum ging, das mathematische Fundament zu legen. Gut fände ich jetzt, wenn es auf dieser Grundlage ein aufbauendes Modul zur Datenanalyse mit R, zur Statistik-Programmierung oder zur Datenvisualisierung gäbe. So etwas hat Springer Campus leider bislang nicht im Angebot. Ich habe mich auch schon umgeschaut, ob man so etwas an anderer Stelle machen könnte. Bislang habe ich leider noch nichts passendes gefunden. Kaiserslautern hat ein Modul "Datenanalyse mit R" im Wahlbereich. Leider ist das Timing der Präsenzveranstaltungen für mich sehr ungünstig, weil sich das mit Präsenztagen in Dortmund beißt. Gerade R würde mich sehr interessieren.

Link zu diesem Kommentar
  • Community Manager
Markus Jung

Geschrieben

Zu R gibt es doch vermutlich auch ziemlich viele freie Quellen im Netz. Vielleicht ist da ja auch was dabei, was du für dich im Selbststudium durcharbeiten könntest. Oder ein gutes Buch dazu. 

 

Ansonsten könntest du auch mal schauen, wo du ggf. Teile aus Psychologie-Studiengängen belegen kannst. Wobei dabei die Benutzung von R oder SPSS vermutlich meist parallel zu den fachlichen Hintergründen vermittelt wird, zumindest war das bei mir an der PFH so. 

Link zu diesem Kommentar

Eine Vermittlung von R parallel zu den statistischen Inhalten fände ich ideal, weil ich glaube, dass es mein Verständnis für die mathematischen Grundlagen noch einmal vertiefen würde.

 

Es gibt ja von Allen B. Downey das kleine, feine Buch "Statistik-Workshop für Programmierer". Die Grundidee ist, dass Studierende die statistischen Konzepte aus einer algorithmischen Perspektive kennenlernen. Und das man bei dieser Art der Vermittlung mehr mit dem Stoff spielen und experimentieren kann. Eingesetzt wird Python und man arbeitet mit einer echten Datenbasis aus einer Studie zum Familienwachstum in den USA. In dem Buch sind auch viele Übungsaufgaben. Da soll dann in der Regel ein Skript geschrieben werden, das ein bestimmtes statistisches Problem löst. Gefällt mir gut, der Ansatz.

 

Ich habe beim Statistik-Modul der W3L gelegentlich auch kleine Java-Programme geschrieben, weil ich manchmal viel manuelle Rechenarbeit mit dem Taschenrechner hatte und sich dann kleine Fehler beim Eintippen der Werte fortgepflanzt haben. Da war ich dann manchmal genervt und habe mir was kleines geschrieben, was auch Zwischenergebnisse ausgibt, so dass ich nachvollziehen konnte, wo in meiner manuellen Rechnung der Fehler auftrat. Oder es diente mir als Kontrolle vor dem Einsenden, ob das, was ich händisch ausgerechnet hatte, auch stimmen konnte.

 

Abgesehen von dem oben erwähnten Buch von Allen B. Downey gibt es viele sehr gute Materialien zum Thema softwaregestützte Statistik und Datenanalyse. Gut gefällt mir zum Beispiel "R: Einführung durch angewandte Statistik" von Hatzinger, Hornik, Nagel und Maier. Das ist wesentlich umfangreicher als das knappe Büchlein von Downey. Auch hier werden die statistischen Konzepte parallel zu einer Programmiersprache - hier eben R - vermittelt.

 

Aber schöner wäre schon, so etwas als richtiges Modul mit Prüfung am Ende zu belegen. Das wäre einfach noch mal ein äußeres Ziel, auf das man hinarbeiten könnte. Wo einem am Ende auch jemand sagt: "Ich hab mir angeschaut, was du gelernt hast, und ich denke, du hast es verstanden."

 

Unsere örtliche Uni bietet über ihr Rechenzentrum einen einführenden Kurs in R an. Ist natürlich Präsenz, aber das ist ein recht kompaktes Format, nämlich ein paar Nachmittage am Stück. So etwas könnte ich evtl. mit meiner Berufstätigkeit vereinbaren. Allerdings scheinen diese Kurse sehr gefragt zu sein. Für dieses Semester ist schon alles ausgebucht.

Link zu diesem Kommentar

Auch die Statistik-Klausur kam heute zurück. Die Korrekturen gingen diesmal echt ziemlich fix. War allerdings auch relativ wenig los am letzten Prüfungstag. Letztes Jahr um diese Zeit ging es auch sehr schnell.

 

Ich bin zufrieden mit dem Ergebnis. Wie schon erwähnt, war Statistik für mich das beste unter den sehr guten Mathe-Modulen bei Springer Campus. Darum freut mich, dass ich auch in der Klausur zeigen konnte, was ich gelernt habe.

 

Die verpflichtenden Mathe-Module liegen nun also hinter mir. Rückblickend betrachtet eigentlich irre. Mathe war schon eine Sache, vor der ich Respekt hatte, denn ich hatte mich viele Jahre überhaupt nicht damit beschäftigt. Kommilitonen wie Dozenten haben mir auch immer wieder geraten, gerade diese Module zügig hinter mich zu bringen. Weil Mathematik etwas sei, woran ein Informatik-Studium scheitern könne. Insofern kann ich es eigentlich noch gar nicht fassen, dass es jetzt tatsächlich geschafft ist. Ging besser als erwartet und hat sogar Spaß gemacht. Fast ein bisschen schade, dass es nun vorbei ist. Auf ein paar Dinge wäre ich noch neugierig gewesen...

Link zu diesem Kommentar
  • Community Manager
Markus Jung

Geschrieben

Klasse, dass du Mathe so gut hinter dich gebracht hast. Ist ja wirklich ein Thema im Informatik-Studium vor dem viele Studierende gehörigen Respekt haben und sich oft auch ziemlich mit rum quälen. Schön, dass es bei dir so problemlos gelaufen ist. Welche Themen würden dich zusätzlich noch interessieren? Oder wärst du vor allem gerne noch tiefer eingestiegen?

Link zu diesem Kommentar

Operations Research oder im engeren Sinne Lineare Optimierung wäre noch interessant gewesen. Wobei das eher in ein Studium der Wirtschaftsinformatik passen würde.

Link zu diesem Kommentar

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden


×
×
  • Neu erstellen...