Navigation

Datenanalyse

A) Stichprobengroesse, Standardabweichung und Standardfehler

B) Auswirkung von Abtastraten

C) Sortieren

D) Hausaufgaben  

A) Stichprobengroesse, Standardabweichung und Standardfehler

T7A1) Die wichtigsten Formeln der beschreibenden Statistik haben wir schon am letzten Kurstag gesehen. Fuer N normalverteilte Messwerte x1 bis xn ermittelt man den empirischen Mittelwert als

Mittelwert

und die empirische Standardabweichung als

Standardabweichung

Auch wenn es keine schlechte Uebung ist, diese Formeln einmal in Matlab umzusetzen, kann man stattdessen auch einfach die Befehle mean und std benutzen.

Allerdings ist bei der Berechnung von Mittelwert und Standardabweichung von Messwerten Vorsicht geboten: Man kennt nur eine begrenzte Stichprobe, die nicht unbedingt die gesamte Population repraesentieren muss. Je groesser diese Stichprobe ist, desto sicherer kann man sich sein, den tatsaechlichen Werten der ganzen Population nahe zu kommen.

Sie haben die Aufgabe, das Fressverhalten von Maeusen zu charakterisieren. Dazu  fuettern Sie die Maeuse ausschliesslich mit genorment Futterpellets und zaehlen taeglich, wieviele Pellets aus dem Futterbehaelter verschwinden.

Schreiben Sie eine Funktion, die zufaellig die Anzahl der von einer Maus gefressenen Pellets ermittelt und zurueckgibt. Dabei soll der Mittelwert der gesamten Maeusepopulation 30 Pellets und die Standardabweichung 5  Pellets betragen.
[zufall.m]

[Leider unkommentierte Kursloesung: zufall_kurs1.m] 

Benutzen Sie diese Funktion in einer weiteren Funktion, die als Eingabeargument die Stichprobengroesse bekommt und als Ausgabe die ermittelten Werte fuer Mittelwert und Standardabweichung zurueckgibt. Ausserdem soll diese Funktion die Verteilung der Werte grafisch als Histogramm darstellen.
[stichprobe.m]

[Leider unkommentierte Kursloesung: stichporbe_kurs1.m] 

Lassen Sie diese Funktion fuer verschiedene Stichprobengroessen laufen, z.B. N=1; N=3; N=5; N=10; N=20; N=50; N=100; N=1000. Wie wirkt sich die Stichprobengroesse auf Mittelwert, Standardabweichung und Histogramm aus? 

T7A2) Um abzuschaetzen, wie gut verwendete Stichproben eine Population charakterisieren, verwendet man den Standardfehler. Dieses Mass gibt die Streuung der Mittelwerte von verschiedenen, zufaellig aus der Population gezogenen Stichproben gleichen Umfangs um den wahren Populationsmittelwert an. Der Standardfehler ist definiert als

Standardfehler

Wobei n die Groesse der Stichproben angibt (nicht die Anzahl der Stichproben!) und σ die Standardabweichung der empirisch ermittelten Mittelwerte.

Programmieren Sie eine Funktion, die fuer Sie eine ganze Messreihe des Maeusefressverhaltens steuert. Die Funktion bekommt als Eingabeargumente die jeweilige Stichprobengroesse (also wieviele Maeuse pro Tag beobachtet werden sollen) und die Anzahl der Stichproben (also an wievielen Tagen gezaehlt werden soll) und liefert als Rueckgabewert den Standardfehler. Ausserdem zeigt sie die Verteilung der erzielten Mittelwerte als Histogram grafisch an.
[standardfehler.m]
[fehlerreihe.m]

[Leider unkommentierte Kursloesung: standardfehler_kurs1.m] 

Probieren Sie diese Funktion fuer verschiedene Kombinationen aus Stichprobengroesse und Anzahl der Stichproben aus, z.B. 3 Stichproben mit 3 Tieren, 10 Stichproben mit 3 Tieren, 3 Stichproben mit 10 Tieren, 10 Stichproben mit 10 Tieren, 10 Stichproben mit 100 Tieren, 100 Stichproben mit 10 Tieren, 100 Stichproben mit 100 Tieren, 1000 Stichproben mit 10 Tieren, 10 Stichproben mit 1000 Tieren. Wie wirken sich die beiden Parameter auf den Standardfehler aus? Wie auf die Verteilung der Mittelwerte?

T7A3) Die vorige Aufgabe war insofern unrealsistisch, als alle Tiere statistisch gleich viel Hunger hatten. Natuerlich gibt es aber bei echten Tieren individuelle Unterschiede. In folgender Matrix sind die Messungen von 30 Tieren an 30 Tagen dargestellt, wobei die Werte eines Tieres jeweils in der gleichen Zeile stehen.   [pellets.mat]

Schreiben Sie ein Skript, dass die Mittelwerte und Standardabweichungen einerseits zwischen den Tagen, andererseits zwischen den Tieren berechnet und diese in zwei Abbildungen grafisch darstellt. Der Befehl, um eine Kurve mit Fehlerbalken zu zeichnen heisst errorbar(mw,standabw), wobei mw der Vektor der Mittelwerte und standabw der Vektor der Standardabweichungen ist. 

Inwiefern unterscheiden sich die Ergebnisse fuer die beiden Arten, Mittelwerte und Standardabweichungen zu berechnen?

Berechnen Sie fuer beide Wege den resultierenden Standardfehler. 

Fuehren Sie die gleichen Berechnungen noch einmal fuer folgende Messreihe durch [pellets2.mat], in der ebenfalls die Daten eines Tieres jeweils in einer Zeile stehen. Was sind die Unterschiede?
[maeusestatistik.m]

[Leider unkommentiert: maeusestatistik_kurs1.m] 

B) Auswirkung von Abtastraten

T7B1) Plotten Sie eine Parabel:  x=-5:1:5, y=x.^2, plot(x,y)
Was faellt Ihnen an dieser Parabel auf? Machen Sie die einzelnen Punkte sichtbar.
Machen Sie die Schritte kleiner und plotten Sie die Parabel erneut.
Erstellen Sie einen gemeinsamen plot, bei dem die oben erzeugten Werte mit einzelnen Punkten und die Werte fuer x_fein=-5:0.01:5 mit einer durchgezogenen Linie in eine Abbildung gezeichnet werden.

T7B2) Wenn eine kontinuierliche Groesse gemessen wird, ist die Wahl der Abtastrate eine wichtige Groesse - zu geringe Abtastraten koennen zu grundlegend falschen Ergebnissen fuehren. Dieser Effekt soll mit folgendem Skript verdeutlicht werden:
[aliasing_effekt.m]

Versuchen Sie das Skript nachzuvollziehen. Warum kann das urspruengliche Signal am Schluss nicht mehr rekonstruiert werden? 

C) Sortieren

T7C1) Es kommt haeufig vor, dass man Daten nicht in der Reihenfolge belassen moechte, wie man sie gewonnen hat, sondern nach bestimmten Kriterien sortieren. Dazu gibt es in Matlab den praktischen Befehle sortrows. m2=sortrows(m1,n) sortiert die Zeilen der Matrix m1 gemaess ihren Eintraegen in der n-ten Spalte in aufsteigender Reihenfolge. [m2,index]=sortrows(m1,n) gibt zusaetzlich einen Vektor der Indizes zurueck.

Erzeugen Sie sich aus den in Aufgabe T7A3) gewonnen Mittelwerten und Standardabweichungen der einzelnen Tiere eine Matrix. Sortieren Sie diese Matrix einmal nach den Mittelwerten und einmal nach den Standardabweichungen und lassen beide mit errorbar grafisch anzeigen.  

D) Hausaufgaben 

Nochmal die bisher ungeloesten Aufgaben von Freitag: 

T6H4) Folgende Daten wurden im Rahmen eines F-Praktikums von zwei Teilnehmerinnen dieses Kurses gewonnen: [spikedaten_kurz.mat]. Es handelt sich dabei um intrazellulaere Messungen des Membranpotentials eines Blutegelneurons. Es wurden 10 Antworten dieser Zelle auf einen jeweils gleichen Reiz aufgezeichnet, einen Strompuls, dessen Zeitverlauf (in nA) im mitgespeicherten Vektor stimulus abgelegt ist. Das Neuron antwortet auf diesen Strompuls mit einer Depolarisation des Membranpotentials, die mit sogenannten "spikes" (Aktionspotentialen) ueberlagert ist. Die Daten wurden mit einer Frequenz von 10000 Datenpunkten pro Sekunde aufgenommen.
a) Schreiben Sie ein Skript, um sich alle Antwortspuren gemeinsam mit dem Zeitverlauf der Reizung anzusehen (das darf auch nacheinander sein).
b) Legen Sie "per Augenmass" eine Schwelle fest, mit der sich die Aktionspotentiale finden lassen. Achtung: jeweils am Ende des Strompulses gibt es in der Antwortspur ein Artefakt. Dieses wollen wir moeglichst nicht als Aktionspotential erkennen.
[spikedatenanalyse.m] 

T6H5) Schreiben Sie eine Funktion, die als Eingabeargumente die Matrix mit den Messdaten und einen Schwellwert bekommt und als Ausgabe einen Vektor liefert, wieviele Spikes in den einzelnen Durchlaeufen jeweils ausgeloest wurden.
Bestimmen Sie damit Mittelwert und Standardabweichung der Spikeanzahlen.
[spikes_zaehlen.m] 

[Kursloesung1: T6H5JF.m] 

[Kursloesung2: spikes_zaehlen_kurs1.m (leider unkommentiert)] 

[Kursloesung3: spikefunktion_nc.m] 

[Kursloesung4: spikes_zahlen_kurs.m unkommentiert und mit kleinem Fluechtigkeitsfehler] 

[Kursloesung 5: spikezaehler_kurs1.m]

[Eine fast fertige Kursloesung: spikedaten_birthe.m] 

Und hier noch drei neue Aufgaben:

T7H1) Benutzen Sie das am zur Aufgabe T4H6 entstandene Programm (wenn Sie selber die Aufgabe nicht geloest haben, laden Sie sich eins der Programme herunter), um sich eine Matrix gefangener Voegel zu erstellen. Sortieren Sie diese so, dass, zuerst die Amseln, dann die Rotkehlchen und zuletzt die Meisen in der Matrix stehen, wobei innerhalb dieser Gruppen jeweils zuerst die Maennchen und dann die Weibchen aufgelistet werden. Die Tiere einer Art und eines Geschlechts sollen jeweils nach dem Gewicht sortiert sein.

T7H2) Generieren Sie sich 10 Vogelfang-Matrizen und berechnen Sie fuer jede Kombination von Art und Geschlecht jeweils Mittelwerte und Standardabweichungen des Gewichts, sowie den Standardfehler Ihrer Gewichtsmessungen.

T7H3)  Wie wir bereits am Beispiel der Modellzelle gesehen haben, ist die Antwort einer Apparatur selbst ohne biologisches Praeparat nicht perfekt rauschfrei. Um das Geraeterauschen abzuschaetzen, wurden fuer die Apparatur mit der Modellzelle
100 Messungen (sogenannte "trials") mit dem gleichen Reiz [stimulus.mat] durchgefuehrt und die Antworten als Matrix unter [antworten1khz.mat] abgespeichert. 

Schauen Sie sich ein beliebiges "trial" zusammen mit dem Reiz an (entsprechend der Aufgabe von gestern).
Berechnen und plotten Sie den Zeitverlauf der ueber die trials gemittelten Antwort.
Berechnen und plotten Sie den Mittelwert und die Standardabweichung der jeweils letzten 300ms fuer jedes trial.  Gibt es eine Tendenz? Gibt es Ausreisser?
Sind Mittelwert und / oder Standardabweichung vor, waehrend und nach der Reizung unterschiedlich?

Webmastermtd: Jutta Krupretzqa76nberg (jutdkta.krqgretzberg@u8xolkc.dotanqe) (Stand: 07.11.2019)