STATISTIK-FORUM.de

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 15:09

Hallo zusammen

Ich sitze gerade bei meiner Masterarbeit in Englischer Linguistik und muss meine Daten auswerten...nun bin ich aber eben eher der "Sprachler" und kenne mich mit Statistik nicht so gut aus (der Statistikkurs der Uni hat da auch herzlich wenig gebracht)...

Kontext: Bei meiner Masterarbeit untersuche ich den unbewussten Einfluss von L2 Englisch auf L1 (Muttersprache) Deutsch. Dafür habe ich zwei Tests entwickelt, bei denen die 40 Studienteilnehmer entweder mündlich oder durch drücken einer Taste auf dem Laptop auf Wort-Stimuli reagieren müssen. Diese Stimuli bestehen aus Deutschen Wörtern, 50% davon sind sog. Kognaten mit Englisch und 50% nicht-Kognaten (Kognaten sind z.B. KNIE - KNEE, KONZERT - CONCERT, also Wörter die in den zwei Sprachen sehr ähnlich sind; nicht-Kognaten z.B. BAUM - TREE, ARBEIT - WORK). Meine These ist, dass die Studienteilnehmer schneller auf Kognaten reagieren, da beide Sprachen im Gehirn aktiviert werden. Die Null-Hypothese ist also H0 = μx – μy oder μx – μy = 0 (x = Reaktionszeit auf Kognaten; y = Reaktionszeit auf nicht-Kognaten). Rauskommen sollte, dass die Reaktionszeit auf Kognaten signifikant kürzer ist, als die auf nicht-Kognaten (bei confidence level 95%), also μx < μy.

Ich habe also zwei Gruppen von Wörtern, die ich pro Individuum vergleichen möchte. Bis jetzt habe ich folgendes gemacht (ich hoffe ihr versteht Englisch):
An unpaired, homoscedastic t-test was chosen because the variables of the samples are independent from each other. That is, for example, the reaction time to stimulus #1 (the first cognate) and the reaction time to stimulus #21 (first non-cognate) do not have anything to do with each other, as the stimuli were not paired. For the overall analysis, however, I did a paired t-test, since the stimuli were the same for every individual and it was expected that they would all perform faster on the cognates, i.e., a correlation was expected.

Ich frage mich nun aber ob dies Sinn macht oder ob ich eine falsche Überlegung da drin habe??? Also grundsätzlich: paired oder unpaired beim Individuum bzw. der ganzen Gruppe? Was meint ihr?

Ich bedanke mich schon im Voraus ganz ganz herzlich für jegliche Hilfe!

Liebe Grüsse
S.

PonderStibbons · von **PonderStibbons** » Mi 9. Sep 2015, 15:18

(x = Reaktionszeit auf Kognaten; y = Reaktionszeit auf nicht-Kognaten).

Und Du hast sichergestelt, dass das Stimulusmaterial völlig parallel ist,
was reaktionszeitrelevante Charakteristika angeht (Wortlänge etc.),
ausschließlich abgesehen vom Umstand, ob ein ähnlich klingendes
englsiches Wort existiert oder nicht?

Wie willst Du die Messungen denn verarbeiten, alle 20 Messungen auf
Kognaten zusammenfassen, dito die anderen 20 Messungen, und diese
beiden aggregierten Werte vergleichen? Das wäre, sofern dieselben
Personen alle 2x20 Durchgänge hatten, eventuell dann ein t-Test, und
zwar der für abhängige Messungen.

"Ungepaarte" t-Tests sind für den Vergleich von 2 Gruppen von Probanden
(z.B. Probanden mit versus Probanden ohne Englischkenntnisse).

Mit freundlichen Grüßen

P.

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 16:01

Lieber P.

Danke schonmal für die Antwort.

Ja, Wortlänge und Häufigkeit ist kontrolliert.

Beim einen Test habe ich je 20 Kognaten bzw. nicht-Kognaten pro Individuum, also 40 Wörter insgesamt. Beim anderen Test sind es je 40 (insg. 80).

Ich möchte untersuchen ob

1. die Resultate auf individueller Ebene signifikant sind. Z.B.: Teilnehmer #5 hatte beim 1. Test eine ØRT von 1336.82ms für Kognaten und eine ØRT von 1736.94ms für nicht-Kognaten - heisst dies dass er auf Kognaten signifikant schneller reagiert? Die Durchschnitte basieren bei Teilnehmer #5 auf 39 Kognaten und 36 nicht-Kognaten (dies, da die Stimuli bei diesem Test für max. 5s präsentiert wurden - wenn in dieser Zeit keine Reaktion kam, wurde keine Antwort bzw. keine Zeit registriert).

2. die Resultate insgesamt signifikant sind. Z.B. Beim 2. Test ist die ØRT auf Kognaten 664.58ms (basierend auf 776 Reaktionszeiten von 40 Teilnehmern), ØRT auf nicht-Kognaten 722.36ms (basierend auf 787 Reaktionszeiten von 40 Teilnehmern).

Macht dies Sinn? :oops:

PonderStibbons · von **PonderStibbons** » Mi 9. Sep 2015, 16:12

1. die Resultate auf individueller Ebene signifikant sind.

Wozu interessiert Dich das? Du hast doch eine ganze Gruppe von Leuten.
Worauf würdest Du generalisieren wollen auf Basis des Signifikanztests über
die Daten von #5?

Nebenbei bin ich etwas überrascht, dass Du anhand des Mittelwertes
aggregierst, ich dachte in dem Bereich wäre der Median üblich, wegen
der einflussreichen Ausreißer bei den Reaktionszeitmessungen.

2. die Resultate insgesamt signifikant sind. Z.B. Beim 2. Test ist die ØRT auf Kognaten 664.58ms (basierend auf 776 Reaktionszeiten von 40 Teilnehmern), ØRT auf nicht-Kognaten 722.36ms (basierend auf 787 Reaktionszeiten von 40 Teilnehmern).

Ich weiß nicht, über was da aggregiert wurde. Erst die individuellen
Durchschnitte, und dann wurden die Mittelwert daraus zwischen
den Wortarten per abhängigem t-Test verglichen?

Mit freundlichen GRüßen

P.

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 16:53

Wozu interessiert Dich das?

Weil die Resultate insgesamt wahrscheinlich nicht signifikant sind und dies gegen frühere Studien spricht, hat meine Betreuerin gesagt ich soll "reinzoomen" auf die signifikanten Individuen und schauen, ob die z.B. ihr Englisch-Level besser einschätzen oder sonst was gemeinsam haben. Deshalb sollte ich wissen, welche Teilnehmer einen signifikanten Unterschied zwischen RT zu Kognaten und nicht-Kognaten aufweisen.

Ich weiß nicht, über was da aggregiert wurde. Erst die individuellen
Durchschnitte, und dann wurden die Mittelwert daraus zwischen
den Wortarten per abhängigem t-Test verglichen?

Ich habe ja die ganzen Daten in Excel...da habe ich einfach alle Reaktionszeiten für die Kognaten markiert und daraus den Mittelwert ermittelt und dasselbe für die nicht-Kognaten gemacht. Jetzt würde ich die 2 Mittelwerte gerne vergleichen.

Kann ich dir irgendwie ein Bild senden, damit du siehst wie das bei mir aussieht bzw. was ich bisher gemacht hab?

bele · von **bele** » Mi 9. Sep 2015, 17:35

Hallo statsdummie,

die Geschichte scheint statistisch banal zu sein, ist sie aber nicht. Du kannst nicht einfach 776 Messwerte von der einen Wortart mit 787 Messwerten von der anderen Wortart mit einem t-Test miteinander vergleichen. Eine Voraussetzung des t-Tests ist, dass die Beobachtungen zufällig und voneinander unabhängig sind. Deine sind nicht voneinander unabhängig. Es gibt unter den 40 Leuten sicher schnellere und langsamere und wenn Du nun in der einen Gruppe mehr Messungen von den schnellen und in der anderen mehr Messungen von den langsamen Leuten hast dann vermischt das Ergebnis die unterschiedliche Schnelligkeit der Personen mit der unterschiedlichen Schnelligkeit auf verschiedene Wörter.

Statistisch ruft das nach einem sogenannten hierarchischen Modell, aber darauf hast Du als Statistikanfänger sicher keine Lust. Du könntest stattdessen folgendes tun: Von jedem der 40 Teilnehmer berechnest Du seine durchschnittliche Antwortdauer auf Kognaten und seine durchschnittliche Antwortdauer auf Nicht-Kognaten. Nun hast Du für jeden Teilnehmer seine zwei durchschnittlichen Antwortdauern und die kannst Du in einem t-Test für verbundene Stichproben miteinander vergleichen.

Excel ist nicht unbedingt die beste Wahl dafür, aber bei 40 Leuten und 1500 Messungen wirst Du das schon irgendwie hinkriegen. Du willst das ja nur einmal machen und nicht ständig wiederholen. Sonst würde es sich lohnen, ein "richtiges" Statistikprogramm zu erlernen.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
statsdummie

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 17:49

Lieber Bernhard

Danke für deine Antwort!

Phuu das scheint nichtmal meine Betreuerin (grosser Name in der Linguistik) zu wissen...die hat mir das nämlich so vorgeschlagen...

Statistisch ruft das nach einem sogenannten hierarchischen Modell, aber darauf hast Du als Statistikanfänger sicher keine Lust.

Wenn ich wüsste, was das ist, könnte ich dir sagen, ob ich Lust habe :roll:

on jedem der 40 Teilnehmer berechnest Du seine durchschnittliche Antwortdauer auf Kognaten und seine durchschnittliche Antwortdauer auf Nicht-Kognaten. Nun hast Du für jeden Teilnehmer seine zwei durchschnittlichen Antwortdauern und die kannst Du in einem t-Test für verbundene Stichproben miteinander vergleichen.

Den Teil habe ich also richtig gemacht

Wie sieht es aber auf der individuellen Ebene aus? Es muss doch irgend eine Möglichkeit geben um herauszufinden, ob ein Teilnehmer nun signifikant schneller auf Kognaten reagiert, oder eben "nur schneller"? (siehe Beispiel mit Teilnehmer #5 oben)

Danke schon im Voraus und sorry, dass ich euch so auf Trab halte :oops:

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 18:20

Nachtrag:

Es gibt unter den 40 Leuten sicher schnellere und langsamere und wenn Du nun in der einen Gruppe mehr Messungen von den schnellen und in der anderen mehr Messungen von den langsamen Leuten hast dann vermischt das Ergebnis

Es sind ja alle Teilnehmer in beiden Gruppen... Jede/r der 40 Teilnehmer/innen hat auf Kognaten und nicht-Kognaten reagiert. Sprich allen sind im 1. Test 80 Wörter (50-50 Kogn./n.-Kogn.) und im 2. Test 40 Wörter (50-50 Kogn./n.-Kogn.) präsentiert worden. Gehts dann doch?

bele · von **bele** » Mi 9. Sep 2015, 20:03

Der t-Test sagt: Wenn Du eine Zahl an unabhäningen Zufallsziehungen hast, die alle aus derselben Verteilung stammen, dann kannst Du nach meinen Regeln einen p-Wert berechnen. Deine Werte sind nicht unabhängig bzw. Nicht aus derselben Verteilung gezogen. Ob es eine Ausnahmeregel gibt, wenn in gleich großen Stichproben gleich viele von verschiedenen Probanden stammen? Ist mir nicht bekannt, aber wir können ja mal warten, was PonderStibbons schreibt.

Was Deine Betreuerin zu Statistik sagt, weiß ich natürlich nicht. Vielleicht ist für Deine Arbeit auch wichtiger, was Deine Betreuerin sagt als was in Statistkkbüchern steht.

Wenn Du wirklich wissen willst, ob Kandidat 5 schneller auf das eine als auf das andere reagiert hat, dann geht das als Vergleich seiner beiden Messreihen mit t-Test oder Rangsummentest. Je kleiner die Stichprobe ist, umso kritischer wird die Normalverteilungsannahme des t-Tests.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
statsdummie

statsdummie · von **statsdummie** » Mi 9. Sep 2015, 20:19

Ok ich verstehe, was das Gesamtding anbelangt..

Wenn Du wirklich wissen willst, ob Kandidat 5 schneller auf das eine als auf das andere reagiert hat, dann geht das als Vergleich seiner beiden Messreihen mit t-Test oder Rangsummentest

Wenn ich dies mit dem t-test mache, muss ich dann den gepaarten t-test wählen? Und wenn nicht, homo- oder heteroskedastisch ungepaart?

Sorry

STATISTIK-FORUM.de

Welcher T-Test und weshalb?

Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Re: Welcher T-Test und weshalb?

Wer ist online?