Korrekte Vorgehensweise beim t-test

Korrekte Vorgehensweise beim t-test

Beitragvon dumm2k » Sa 3. Mai 2014, 17:17

Hallo alle :-)
da ich mich wenig in Statistik auskenne, wäre es toll, wenn jmd ein Feedback
über meine geplante Vorgehensweise geben könnte. Danke! :-)

Ich habe 2 unabhängige Datenmengen, die ich gerne vergleichen würde, inwiefern sie sich ähnlen.

1. zuerst überprüfe ich, ob die Datenmengen normalverteilt sind.
Das mache ich mit einem chi-quadrat test.

2. fallen diese jeweils positiv aus, so mache ich einen t-test.
Ansonsten einen wilcoxen rank summen test

Ist diese Vorgehensweise annehmbar oder übersehe ich vielleicht etwas Wichtiges? Sollte ich noch auf bestimmte Dinge besonders achten?
Danke!
dumm2k
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 3. Mai 2014, 17:13
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrekte Vorgehensweise beim t-test

Beitragvon PonderStibbons » Sa 3. Mai 2014, 21:36

Ich habe 2 unabhängige Datenmengen,

Welche Art Daten? Mengen (Stichproben?) welcher Größe? Abhängige oder
abhängige Messungen/Stichproben?
die ich gerne vergleichen würde, inwiefern sie sich ähnlen.

Das wird mit t-Test nicht gehen, der dreht sich um die Frage, ob
Mittelwerte unterschiedlich sind.
1. zuerst überprüfe ich, ob die Datenmengen normalverteilt sind.

Ob das relevant ist, hängt von der Stichprobengröße ab
Ich gehe mal davon aus, dass korrekterweise die beiden
Stichproben getrennt betrachtet werden.
Das mache ich mit einem chi-quadrat test.

Nicht unbedingt die erste Wahl.
Ist diese Vorgehensweise annehmbar oder übersehe ich vielleicht etwas Wichtiges? Sollte ich noch auf bestimmte Dinge besonders achten?

Auf Ausreißer sowie auf Varianzhomogenität (falls die Stichproben ungleich groß sind).

Während ich dies schreibe, wundere ich mich allerdings ein wenig über
die Fragen bzw. darüber was fehlt. Das wird doch im Internet und
Anfängerbüchern rauf und runter beschrieben?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11269
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2475 mal in 2459 Posts

folgende User möchten sich bei PonderStibbons bedanken:
dumm2k

Re: Korrekte Vorgehensweise beim t-test

Beitragvon dumm2k » So 4. Mai 2014, 11:18

Hallo,
zuerst einmal Danke für die Antwort :-)

PonderStibbons hat geschrieben:
Ich habe 2 unabhängige Datenmengen,

Welche Art Daten? Mengen (Stichproben?) welcher Größe? Abhängige oder
abhängige Messungen/Stichproben?


Die Messungen sind unabhängig. Bei den Daten handelt es sich um Simulationsdaten von biologischen Vorgängen.
Im Konkreten um Mittelwerte von Atom-Koordinaten einer biologischen Gruppe A(n=70) über einen Zeitverlauf, die
mit einer biologischen Gruppe B(n=80) verglichen werden sollen. Wobei aber im Konkreten die Verteilung der Atomkoordinaten über
den Zeitverlauf verglichen werden soll.

die ich gerne vergleichen würde, inwiefern sie sich ähnlen.

Das wird mit t-Test nicht gehen, der dreht sich um die Frage, ob
Mittelwerte unterschiedlich sind.


Sorry, war von mir schlecht formuliert. Das hab ich eigentlich auch gemeint :-)

1. zuerst überprüfe ich, ob die Datenmengen normalverteilt sind.

Ob das relevant ist, hängt von der Stichprobengröße ab
Ich gehe mal davon aus, dass korrekterweise die beiden
Stichproben getrennt betrachtet werden.
Das mache ich mit einem chi-quadrat test.

Nicht unbedingt die erste Wahl.


Stichprobengröße für A und B ergibt sich aus dem Mittelwert der Atom-Koordinaten über einen Zeitverlauf.
Das wäre dann n=3000 (=Zeitschritte);
Was hälst du von Shapiro-Wilk oder Shapiro-Francia ?

Ist diese Vorgehensweise annehmbar oder übersehe ich vielleicht etwas Wichtiges? Sollte ich noch auf bestimmte Dinge besonders achten?

Auf Ausreißer sowie auf Varianzhomogenität (falls die Stichproben ungleich groß sind).


Ok, danke für den Hinweis.

Während ich dies schreibe, wundere ich mich allerdings ein wenig über
die Fragen bzw. darüber was fehlt. Das wird doch im Internet und
Anfängerbüchern rauf und runter beschrieben?
P.


Sorry, mein Posting war wohl nicht detailliert genug. Werde mich bemühen in Zukunft umfassender und akkurater zu formulieren :-)
Ein positives Feedback von Fachleuten tut halt immer gut ;)
dumm2k
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 3. Mai 2014, 17:13
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrekte Vorgehensweise beim t-test

Beitragvon PonderStibbons » So 4. Mai 2014, 12:52

Stichprobengröße für A und B ergibt sich aus dem Mittelwert der Atom-Koordinaten über einen Zeitverlauf.
Das wäre dann n=3000 (=Zeitschritte);

Das ist jetzt allerdings verwirrend.
Es war doch die Rede von 2 unabhängigen Gruppen, n=70 und n=80,
die mittels t-Test verglichen werden sollen. Woher kommen nun
n=3000? Wenn pro Fall mehr als 1 Messung vorliegt, ist das kein Fall
für den t-Test. Oder werden pro Fall mehrere Messungen aggregiert
und die aggregierten Messungen werden zwischen den Gruppen
verglichen?
Was hälst du von Shapiro-Wilk oder Shapiro-Francia ?

Bei n > 50 ist ein t-Test robust gegen Abweichungen
von der Normalverteilung der Variablen innerhalb der
beiden Gruppen. Allerdings verstehe ich das Desgin wie
gesagt nicht und weiß nicht, ob t-Test hier angebracht ist.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11269
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2475 mal in 2459 Posts

folgende User möchten sich bei PonderStibbons bedanken:
dumm2k

Re: Korrekte Vorgehensweise beim t-test

Beitragvon dumm2k » So 4. Mai 2014, 13:37

PonderStibbons hat geschrieben:
Stichprobengröße für A und B ergibt sich aus dem Mittelwert der Atom-Koordinaten über einen Zeitverlauf.
Das wäre dann n=3000 (=Zeitschritte);

Das ist jetzt allerdings verwirrend.
Es war doch die Rede von 2 unabhängigen Gruppen, n=70 und n=80,
die mittels t-Test verglichen werden sollen. Woher kommen nun
n=3000? Wenn pro Fall mehr als 1 Messung vorliegt, ist das kein Fall
für den t-Test. Oder werden proi Fall mehrere Messungen aggregiert
und die aggregierten Messungen werden zwischen den Gruppen
verglichen?


vielleicht beschreibe ich mal ganz ausführlich, was ich gemacht habe:

ich habe ein biologische Struktur A, die aus mehreren tausenden Atomen besteht, von denen ich die Atomkoordinaten habe.
Nun habe ich auch die Koordinaten über einen Zeitverlauf von 20 Nanosekunden (damit waren die 3000 Zeitschritte gemeint).
Von der biologischen Struktur habe ich, sagen wir salopp gesagt, 70 Simulationen gemacht.
Danach habe ich die Distanz zwischen den Atomen innerhalb dieser Struktur berechnet und dann den Durchschnitt von den 70 Simulationen.
Somit habe ich am Ende die Mittelwerte der Distanz zwischen Atomen über einen Zeitraum von 20 Nanosekunden.

Nun möchte diese Daten mit einer anderen biologischen Struktur B vergleichen, wo ich ebenfalls die Distanz habe und
ebenfalls eine Zeitaufnahme von 20 Nanosekunden habe. Von dieser Struktur, habe ich allerings 80 Simulationen.

Nun möchte ich diese Verteilung über diese 20 Nanosekunden(die Mittelwerte) von den Strukturen A mit der von B vergleichen.
Ich hoffe das war verständlich und danke für deine Mühe :-)

Was hälst du von Shapiro-Wilk oder Shapiro-Francia ?

Bei n > 50 ist ein t-Test robust gegen Anbweichungen
von der Normalverteilung der Variablen innerhalb der
beiden Gruppen. Allerdings verstehe ich das Desgin wie
gesagt nicht und weiß nicht, ob t-Test hier angebracht ist.

Mit freundlichen Grüßen

P.


Naja, aber muss ich nicht bevor ich einen t-test anwende überprüfen, ob überhaupt die Daten normalverteilt sind? Anhand von Recherchen wurde diese Tests Shapiro-Wilk oder Shapiro-Francia empfohlen :-)
Zuletzt geändert von dumm2k am So 4. Mai 2014, 16:03, insgesamt 1-mal geändert.
dumm2k
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 3. Mai 2014, 17:13
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrekte Vorgehensweise beim t-test

Beitragvon PonderStibbons » So 4. Mai 2014, 14:27

Naja, aber muss ich nicht bevor ich einen t-test anwende überprüfen, ob überhaupt die Daten normalverteilt sind?

Bei n > 50 ist der t-Test robust gegen Abweichungen
der Variablen innerhalb der beiden Gruppen von der
Normalverteilung.

Wenn Du trotzdem überprüfen willst, ob die Daten aus
normalverteilten Grundgesamtheiten stammen, bleibt Dir
das natürlich unbenommen. Das Verfahren ist dann eher
wumpe, da hier das Ergebnis für den t-Test nicht relevant
ist. Grafische Verfahren wie Q-Q plots sind manchmal ganz
hübsch.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11269
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2475 mal in 2459 Posts


Zurück zu t-Test

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste