STATISTIK-FORUM.de

Hallo zusammen,

bin neu hier und habe mich frustriert angemeldet, weil meine "statistische Beratung" leider ein schlechter Witz war, sodass ich mir nun den Großteil meiner Statistik in mühsamer Eigenrecherche nach bestem Wissen erstellt habe.
Wäre sehr dankbar, wenn jemand Lust hätte sich meinen Problemen anzunehmen und mein Halbwissen richtigzustellen.
Ich versuche es möglichst simpel zu halten, die Arbeit beschreibt den Einfluss der Zeit auf die Verschlechterung der Lungenfunktion bei einer bestimmten Erkrankungen.

Frage 1:
Ich habe zunächst gängige Variablen (Alter, Größe, Gewicht) auf Normalverteilung geprüft und somit festgehalten, dass Normalverteilung in meinem Kollektiv vorliegt. Somit habe ich diese auch für die Lungenfunktion vorausgesetzt und mit dem T-Test gearbeitet. War das doof? Muss jede Variable einzeln auf Normalverteilung geprüft werden, bevor getestet wird? Im Shapiro Test der Variable "Lungenfunktion" wäre diese nämlich nicht normalverteilt.

Frage 2:
Gruppe 1 geht nach Husten direkt zum Arzt und bekommt ein Medikament
Gruppe 2 erhält erst nach 3 Monaten einen Arzttermin und dann das Medikament
Nach individuellem Zeitraum kommt jeder Patient im Verlauf nochmals zum Arzt (Follow-Up). Jeweils beim ersten Kontakt und im Follow Up wird die Lungenfunktion geprüft.

Die Hypothese ist, dass Gruppe 1 sowohl anfangs als auch im Follow-Up eine bessere Lungenfunktion hat als Gruppe 2 (mangels rechtzeitiger Therapie).
Grafisch konnte ich das auch schon darstellen, die Frage ist ob das Signifikanzniveau erreicht wird.
Welchen Test verwende ich da am besten? Wäre dieser Test auch anwendbar, wenn es nach dem Follow-Up nochmal ein long term Follow-Up gibt?

Frage 3:
Man will ausschließen, dass andere Medikamente, welche viele Patienten einnehmen, verstärkt in Gruppe 1 oder 2 eingenommen werden und somit das Ergebnis verfälschen könnten.
Wie mache ich das? Muss/darf ich hier auch von "Signifikanz" sprechen was die Unterschiede in den Medikamenten angeht oder darf man das nur im Zusammenhang mit der H0 Hypothese?
Deskriptiv wäre es ja einfach zu sagen, dass Medikament X in Gruppe 1 von 60% der Pat eingenommen wird und in Gruppe 2 von 67%. Ist dies nun aber ein "signifikanter" Unterschied oder vernachlässigbar?

Frage 4:
Aufbauend auf Frage 3 möchte man nicht nur ein Medikament als Einflussfaktor untersuchen, sondern auch andere oder z.B. das Alter.
Müsste man hier nun eine Multivarianzanalyse durchführen?

Soweit nun erstmal. Wie gesagt bin ich unendlich dankbar für jede (Teil-)Antwort, ich hänge hier grade echt fest und kriege graue Haare

LG Nighty

Eine zusammenhängende und nachvollziehbare Studienbeschreibung wäre nützlich.
Wie lautet das Thema und die konkrete Fragestellung der Studie? Wie sah das
Studiendesign aus, welche Variablen wurden wann bei wem erhoben, konkret wie
wurden die Variablen gemessen, wie groß ist die Stichprobe?

Mit freundlichen Grüßen

PonderStibbons

Vielen Dank schon mal für die Antwort.

PonderStibbons hat geschrieben: Wie lautet das Thema und die konkrete Fragestellung der Studie?

Das Thema und die Fragestellung ist "der Einfluss der Zeit bis zur Diagnosestellung bei pulmonaler Systemsklerose".

PonderStibbons hat geschrieben: Wie sah das Studiendesign aus, welche Variablen wurden wann bei wem erhoben, konkret wie wurden die Variablen gemessen, wie groß ist die Stichprobe?

Hiezu wurden bei 144 Patienten retrospektiv aus den Arztbriefen zw. 2002-2017 neben der Epidemiologie auch Werte der Lungenfunktion erhoben (Vitalkapazität, CO-Diffusion). Zeiträume des Beschwerdebeginns und der Zeit bis zur Diagnose der Erkrankung konnten aus den jeweiligen Anamnesen berechnet werden. Die meisten Patienten waren mehrfach in der Klinik, sodass ein zeitlicher Verlauf generiert werden konnte. Man versucht nun, diejenigen Patienten mit schneller Diagnosestellung (<3 Monate) von denen mit später Diagnosestellung (4-18 Monate) und (>18 Monate) auf den Einfluss der Diagnosezeit auf den Krankheitsverlauf und die Organschäden hin zu untersuchen. Diese 3 generierten Subgruppen sind etwa gleich groß.

Vitalkapazität und CO-Diffusion bei Erstkontakt lässt sich zwischen den
Gruppen wohl ohne weiteres vergleichen.
Wie variabel ist danach die Zeit bis zum Follow-up? Wieviele Patienten haben
überhaupt ein Follow up? Wie variabel ist die Zeit bis zum Langzeit-Follow-up
und wieviele Patienten haben überhaupt eins?

Ist die Einteilung in 3 Gruppen in Stein gemeisselt? Es wirkt einigermaßen
befremdlich, dass z.B. arbiträr jemand mit 3,9 Monaten "kurz" ist, 2 Tage
später aber "mittel" ist und damit gleich behandelt wird wie jemand mit
18 Monaten. Man könnte Zeit bis Diagnosestellung doch einfach als
kontinuierlichen Prädiktor verwenden (lineare Regression statt Varianzanalye).
Weitere Prädiktoren wie Alter, Geschlecht, Medikation lassen sich dabei
zusätzlich einbeziehen.

Was die Frage nach der Bedeutsamkeit konfundierter Faktoren wie die
Medikamente angeht, da ist eigentlich die Betrachtung der Deskriptivstatistik
in der Stichprobe relevant, aber es wird sich womöglich herausstellen, dass
Deine Gutachter einen Signifikanztest verlangen.

Mit freundlichen Grüßen

PonderStibbons

PonderStibbons hat geschrieben: Wie variabel ist danach die Zeit bis zum Follow-up?
Wieviele Patienten haben überhaupt ein Follow up? Wie variabel ist die Zeit bis zum Langzeit-Follow-up
und wieviele Patienten haben überhaupt eins?

Die Patienten kommen in keinem festgeschrieben Zeitraum, sondern dann, wenn ein jeweiliger Termin vereinbart wurde oder zunehmende Beschwerden sie dazu drängen.
Etwa 3/4 haben einen Zweitaufenthalt, dieser erfolgt im Median in 35 (IQR 16 - 61 Monaten). Die Hälfte hiervon hat wiederum einen Langzeit-Follow-up.

PonderStibbons hat geschrieben:Ist die Einteilung in 3 Gruppen in Stein gemeisselt? Es wirkt einigermaßen
befremdlich, dass z.B. arbiträr jemand mit 3,9 Monaten "kurz" ist, 2 Tage
später aber "mittel" ist und damit gleich behandelt wird wie jemand mit
18 Monaten. Man könnte Zeit bis Diagnosestellung doch einfach als
kontinuierlichen Prädiktor verwenden (lineare Regression statt Varianzanalye).
Weitere Prädiktoren wie Alter, Geschlecht, Medikation lassen sich dabei
zusätzlich einbeziehen.

Klingt sehr gut und sinnvoll! Leider hat mich mein Statistiker damals nicht auf diese Möglichkeit hingewiesen, sodass nun die ganze Arbeit auf diese 3 Gruppen aufgebaut ist und es somit quasi schon in Stein gemeißelt ist

PonderStibbons hat geschrieben:Was die Frage nach der Bedeutsamkeit konfundierter Faktoren wie die
Medikamente angeht, da ist eigentlich die Betrachtung der Deskriptivstatistik
in der Stichprobe relevant, aber es wird sich womöglich herausstellen, dass
Deine Gutachter einen Signifikanztest verlangen.

Dies würde ich dann über eine Parameterschätzung machen, oder?

Könnte Sie bitte noch kurz etwas zu meiner Anfangsfrage sagen, ob jede Variable einzeln auf Normalverteilung geprüft werden muss oder man das Kollektiv anfangs durch Stichproben einzelner Variablen als normalverteilt definiert?

Normalverteilung von Variablen ist doch völlig irrelevant.
post39620.html#p39620
post40260.html#p40260
post35909.html#p35909
post35820.html#p35820
search.php?keywords=nicht+normalverteilt

Oder gibt es einen speziellen Grund für die Frage?

Mit freundlichen Grüßen

PonderStibbons

Hi,

Im Shapiro Test der Variable "Lungenfunktion" wäre diese nämlich nicht normalverteilt.

- zunächst wichtig sind Messverfahren und Maßeinheiten aller Modell-AVs.
Der gennante Signifikanztest ist unsofern nicht geeignet weil die NV-Wunschhypothese (H1) gleich der H0 des Shapiro-Wilk Tests ist. Dies bedeutet, dass mit zunehemndem Stichprobenumfang NV abzulehnen ist.
Soweit es Signifikanztests des Allgemeinen linearen Modells betrifft (i.E. T-Tests, Lineare Regression -und auch Varianzanalysen, weil es dasselbe ist) wären die Modellresiduen auf Verteilung zu inspizieren.

Gruß
S.

STATISTIK-FORUM.de

Bitte um stat. Hilfe

Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe

Re: Bitte um stat. Hilfe