STATISTIK-FORUM.de

Hallo zusammen,

im Rahmen einer Hausarbeit muss ich einen Datensatz untersuchen. Dabei handelt es sich um 60 Beobachtungen über das Haarwachstum von Menschen. Dabei gibt es zwei verschiedene Shampoos und drei verschiedene Dosierungen dieser Shampoos, sodass jede Kombination zehnmal vorkommt. Über den Shapiro-Wilk-Test habe ich rausgefunden, dass die Daten annähernd normalverteilt sind (p=0,1091). Daher kann ich den t-Test durchführen.
In der Vorlesung haben wir gelernt, dass einige Verfahren nur für intervallskalierte Daten durchgeführt werden können und man die Daten von der Verhältnisskala über logarithmieren auf die Intervallskala transferiert. Muss dies für den t-Test auch gemacht werden oder kann ich diesen mit dem Basisdatensatz auf der Verhältnisskala durchführen?

Vielen Dank schon einmal für Eure Hilfe!

Ohne Logarithmus rechnen. Aber warum t-Test?

Hi,

- es ist zu empfehlen, dass Du zunächst Dein Untersuchungs-Design klar darstellst
- und was du überhaupt feststellen willst

Gruß
S.

Dabei gibt es zwei verschiedene Shampoos und drei verschiedene Dosierungen dieser Shampoos, sodass jede Kombination zehnmal vorkommt.

Sind das 6 Gruppen oder haben dieselben Leute alle 6 Bedingungen
durchlaufen, oder war das Design noch anders?

Über den Shapiro-Wilk-Test habe ich rausgefunden, dass die Daten annähernd normalverteilt sind (p=0,1091).

Wenn man präzise sein will: Es ist nicht möglich, durch einen statistischen
Signifikanztest soetwas nachzuweisen.
Allenfalls ist hier festzustellen, dass die Nullhypothese (" die Daten stammen aus
einer normalverteilten Grndgesamtheit") nicht verworfen werden konnte.

Bei kleineren Stichproben tritt so ein Nicht-Verwerfen sogar bei markant
nicht-normalen Verteilungen auf (zu wenig Daten, um die Nullhypothese
verwerfen zu können), das ist eben kein Beleg für Normalverteilung.

Wichtige: eine (Normal-)Verteilung der Daten ist für so ziemlich alle gängigen
Verfahren (wie Varianzanalyse, t-Test, lineare Regression) irrelevant, weil nur die
Verteilung innerhalb der Gruppen bzw. die Verteilung der Vorhersagefehler
(Residuen) mitunter wichtig ist für die Zuverlässigkeit der Tests. Und zwar bei
kleinen Stichproben. Bei Stichproben ab ca. > 30 kann man davon ausgehen, dass
Abweichungen von der Normalverteilung der Residuen bzw. in den Gruppen die
Zuverlässigkeit der Tests nicht mehr beeinträchtigt (vgl. "zentraler Grenzwertsatz").

Daher kann ich den t-Test durchführen.

Der passt hier allem Anschein nach nicht (6 Gruppen, oder
eine Gruppe mehrfach gemessen, oder 2 Gruppen mehrfach
gemessen).

In der Vorlesung haben wir gelernt, dass einige Verfahren nur für intervallskalierte Daten durchgeführt werden können und man die Daten von der Verhältnisskala über logarithmieren auf die Intervallskala transferiert.

Dass das nicht nachvollziehbar ist bzw. ein Missverständnis, hatten
wir doch bereits? Da wird nichts transferiert und es gibt keinen
ersichtlichen Anlass für eine logarithmische Transformation hier.

Ratioskala heißt doch nur, dass es einen natürlichen Nullpunkt gibt und
daher Divisionen durchgeführt werden könnten. Vielleicht bezieht sich die
Angabe zum Logarithmieren auf Variablen, die durch Division zweier
Ausgangsvariablen gebildet wurden und deswegen sehr ungewöhnliche
Verteilungenb aufweisen?

Mit freundlichen Grüßen

PonderStibbons

STATISTIK-FORUM.de

Zweiseitiger t-Test bei vehältnisskalierten Daten

Zweiseitiger t-Test bei vehältnisskalierten Daten

Re: Zweiseitiger t-Test bei vehältnisskalierten Daten

Re: Zweiseitiger t-Test bei vehältnisskalierten Daten

Re: Zweiseitiger t-Test bei vehältnisskalierten Daten