Ich habe mich in den vergangenen Tagen intensiv mit dem Äquivalenztest befasst. Unter anderem habe ich hier eine interessante Richtlinie zur Bestimmung von delta, dem Abweichungswert der (korrgiert mit der Standardabweichung) gefunden:
http://www.ema.europa.eu/docs/en_GB/doc ... 003636.pdfEs haben sich jetzt Zweifel bei mir eingestellt ob der Äquivalenztest tatsächlich das ist was ich suche. Ich verstehe es so, dass der Äuqivalenztest ein Test auf praktische Signifikanz ist, nicht aber auf statistische Signifikanz. Angenommen ich führe meinen t-Test durch und es zeigt sich, dass es keinen statistischen Unterschied gibt. Dann brauche ich auch nicht den Äquivalenztest auf praktische Signifikanz durchzuführen, da nicht nachgewiesen ist, dass Unterschiede überzufällig sind. Wenn aber nachgewiesen ist, dass Unterschiede überzufällig sind, muss noch überprüft werden, ob sie überhaupt praktisch signifikant sind. Ich habe Informationen über den Äquivalenztest meist im Zusammenhang mit der Testung von neuen Arzneimitteln gefunden. Wenn ein neues, billiger herzustellendes Arzneimittel "äquivalent" zu einem bereits bekannten, teurer herzustellenden Arzneimittel ist, d.h. es gibt keinen "praktisch signifikanten Unterschied" (wiewohl es statistisch signifikante Unterschiede geben, die aber zu gering sind um praktisch signifikant zu sein), macht es natürlich Sinn einen Äquivalenztest durchzuführen.
Ich fürchte aber, dass man diese Vorgehensweise nicht so ohne weiteres auf meine Untersuchung übertragen kann. Ich habe vielleicht den Fehler gemacht, keine inhaltliche Angaben zu meiner Untersuchung zu machen. Ich lasse verschiedene Arten von Aufgaben von Versuchspersonen bearbeiten. Durch intraindividuelle Leistungsunterschiede in den erbrachten Leistungen bei diesen Aufgaben sollten Rückschlüsse auf das Vorhandensein bestimmter Strukturen im menschlichen Gehirn möglich sein. Ob praktische Signifikanz gegeben ist, wie es bei der Einführung eines neuen Medikaments interessant ist, ist hier eigentlich nicht die Fragestellung.
Insofern würde ich sagen, die Fragen meines letzten Posts, der sich auf die Möglichkeit der Kombination von t-Tests und Äquivalenztests bezog, ist eher unsinnig. Generell würde ich aus heutiger Sicht folgendes behaupten: Es muss zunächst IMMER der t-Test durchgeführt werden. Wenn dieser nicht signifikant wird, braucht man sich über die praktische Signifikanz gar keine Gedanken zu machen. Statistische Signifikanz ist also eine notwendige, aber keine hinreichende Bedingung für praktische Signifikanz.
Insofern stelle ich mir nun erneut die Frage, ob nicht die Vorgehensweise die ich anfänglich zurückgewiesen hatte, hier doch die angemessene sein könnte: Einfach den alpha-Wert des t-Tests hochsetzen und von "statistischer Äquivalenz" ausgehen, wenn der nicht unterschritten wird. Ist z.B. die Irrtumswahrscheinlichkeit beim t-Test >= .95, würde ich mit einer Irrtumswahrscheinlichkeit von 5 % davon ausgehen, dass die beiden Mittelwerte "statistisch äquivalent" sind. Wenn man den Anspruch niedriger setzen will, könnte man sagen, wenn beim t-Test die Irrtumswahrscheinlichkeit >=.80 liegt, kann man mit einer Irrtumswahrscheinlichkeit von 20 % davon ausgehen, dass die beiden Mittelwerte "statistisch äquivalent" sind.
Genau das was ich anfangs für falsch hielt, und was seltsamerweise in der Literatur häufig auch als falsch bezeichnet wird, nämlich dass nicht-signifikant-werden eines t-Tests ein Nachweis dafür ist, dass es keine Unterschiede zwischen Gruppen gibt, wäre dann doch korrekt!!
PonderStibbons, Du hast mich auf die Fährte mit den Äquivalenztests gebracht. Könntest Du (oder jemand anderes der es weiß) mir signalisieren ob ich mit meinen Überlegungen richtig liege?
Besten Dank!
Alfred Folger