Badania kohortowe

Statystyk

epidemiologia statystyka`

Realizacja ALGORYTMu BADANIA KOHORTOWEGO – symulacja
Typ: badanie retrospektywne* Sebastian Żywicki
* badanie, w którym efekt końcowy (ujawnienie nowotworu płuc) wystąpił przed rozpoczęciem badania

etap 1 Ustalenie liczebności w grupach
próba statystyczna I – osoby narażone na działanie czynnika (Rn-222): 529
próba statystyczna II – osoby nie narażone na działanie czynnika (Rn-222): 512

etap 2 Rejestracja zmian nowotworowych w obu próbach, w okresie ostatnich 10 lat

TABELA KONTYNGENCJI

zmienna objaśniana (Y)

wystąpienie zmian

brak zmian

suma

X

osoby narażone

14

515

529

osoby nie narażone

6

506

512

suma

20

1021

1041

etap 3 zapadalność w obu grupach
Osoby narażone na działanie Rn-222 (ekspozycja na czynnik; inhalacja Rn-222)

    \[Z_{Rn-222} =\frac{14}{529}=0,02646\]

Zachorowalność w grupie ryzyka wynosi 2,646%

    \[Z_{NORn} =\frac{6}{512}=0,01172\]

Zachorowalność w grupie bez czynnika wynosi 1,172%

etap 4 kalkulacja ryzyka względnego RR (RW, HR [hazard risk])

    \[RR = \frac{Z_{Rn-222}}{Z_{NORn}}= \frac{0,02646}{0,01172}=2,26 \]

Relatywna zmiana ryzyka zachorowania wynosi 2,26 i oznacza, że osoby podlegające oddziaływaniu radonu są ponad dwukrotnie bardziej narażone na raka płuc aniżeli osoby nie narażone.

etap 5 kalkulacja ryzyka przypisanego ekspozycji

    \[ARR = Z_{Rn-222}-Z_{NORn} = 0,02646-0,01172 = 0,01472 \]

etap 6 określenie ilorazu szans (OR) [odds ratio]

    \[OR=\frac{14\cdot 506}{6\cdot 515} = 2,29 \]

Jako że OR>1, to czynnik może stanowić przyczynę pojawienia się choroby.

etap 7 ustalenie przedziału ufności (CI) dla ryzyka względnego

95% przedział ufności OR (w zapisie skrótowym 95% CI RR)
poziom istotności α = 1-0,95= 0,05

    \[Z_{0,05}(\infty) = 1,96 \]

Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com/data/standard-normal-distribution-table.html lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)

RR= 2,26
ln(RR)=0,8153

Wariancja ln(RR)

    \[Var= \frac{\frac{515}{14}}{14+515}+\frac{\frac{506}{6}}{6+506} = \frac{36,7857}{529}+\frac{84,3333}{512}=0,2362 \]

Błąd standardowy logarytmu naturalnego RR

    \[SE= \sqrt{Var}= \sqrt{0,2362}=0,4860 \]

Górna 95% granica ln(RR) = 0,8153+1,96*0,4860 = 1,7679
Dolna 95% granica ln(RR) = 0,8153-1,96*0,4860= -0,1373

Górna granica RR = exp(górna granica ln(RR)) = 5,86
Dolna granica RR = exp(dolna granica ln(RR) = 0,87

W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
RR= 2,26; 95% CI 0,87 5,86

Przedział zawiera wartość RR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji. Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość RR leży w dużej odległości od 1.

etap 8 ustalenie przedziału ufności (CI) dla ilorazu szans (OR)

95% przedział ufności OR (w zapisie skrótowym 95% CI OR)
poziom istotności α = 1-0,95= 0,05

    \[Z_{0,05}(\infty) = 1,96 \]

Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
OR= 2,29
ln(OR)=0,8285

Wariancja ln(OR)

    \[Var= \frac{1}{14}+\frac{1}{515}+\frac{1}{6}+\frac{1}{506}=0,25979 \]

Błąd standardowy logarytmu naturalnego OR

    \[SE= \sqrt{Var}= \sqrt{0,25979}=0,50970 \]

Górna 95% granica ln(OR) = 0,8285+1,96*0,5097 = 1,7600
Dolna 95% granica ln(OR) = 0,8285-1,96*0,5097= -0,1705

Górna granica OR = exp(górna granica ln(OR)) = 6,21
Dolna granica OR = exp(dolna granica ln(OR) = 0,84

W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis

OR= 2,29; 95% CI 0,84 6,21

Przedział zawiera wartość OR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji.
Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość OR leży w dużej odległości od 1. Sebastian Żywicki

Badania kohortowe

Sebastian Żywicki Szczecin

Testowanie alternatywne

test zgodności chi-kwadrat Pearsona

Testowanie hipotezy o braku związku pomiędzy podwyższonym poziomem Rn-222 i zapadalnością na nowotwór płuc

hipoteza zerowa H0: „nie ma różnic w zachorowalności na nowotwór płuc pomiędzy grupą poddawaną ekspozycji na Rn-222 i grupą nie poddawaną ekspozycji”
Wynik eksperymentu:
TABELA KONTYNGENCJI

zmienna objaśniana (Y)

wystąpienie zmian

brak zmian

suma

X

osoby narażone

14

515

529

osoby nie narażone

6

506

512

suma

20

1021

1041

 

Do testowania hipotezy zerowej można wykorzystać surowe formuły matematyczne

    \[\Huge{\chi{^2}}= \sum_{i=1}^{r} \sum_{j=1}^{k} \frac{(n_{ij}-\hat{n}_{ij})^2}{\hat{n}_{ij}}\]

    \[ \hat{n}_{ij}= \frac{\sum_{i=1}^{r}n_{ij}\cdot\sum_{j=1}^{k}n_{ij}}{n}\]

lub skorzystać ze sprawdzonego szablonu (gdzie wartości poszczególnych komórek tabeli mają swoje miejsce w poniższym równaniu)

    \[\chi{^2}= \frac{(1041) \cdot(14 \cdot506-6\cdot 515)^2}{20 \cdot 512 \cdot 529 \cdot 1021} = \frac{1,661 \cdot 10^{10}}{5,53072 \cdot 10^9}= 3,0025\]

Dla założonego przedziału ufności 95% poziom istotności wynosi 0,05. Poziom istotności  to wartość prawdopodobieństwa przyjęcia hipotezy zerowej podczas gdy w rzeczywistości jest ona fałszywa. W przedstawionej tabeli liczba stopni swobody wynosi  df =1 {(liczba kolumn-1)·(liczba wierszy-1) a wartość statystyki wynosi:

    \[\chi{^2}{_{(0,05;1)}= 3,84146 \]

Wartość statystyki odnajdziesz z łatwością np tu: http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_chi-kwadrat

Jeżeli \chi{^2} \geqslant \chi{^2}{_{(0,05;1)} to odrzucamy H_0 na rzecz hipotezy alternatywnej
Jeżeli \chi{^2} \leqslant \chi{^2}{_{(0,05;1)} to przyjmujemy H_0 (nie ma podstaw do odrzucenia)

W przypadku tej symulacji, z radością przyjmujemy hipotezę H_0, mówiącą o braku zależności pomiędzy ekspozycją i skutkiem, z prawdopodobieństwem wyższym niż 0,95.

Zwróć jednak uwagę, że gdyby badacz dopuścił możliwość popełnienia błędu na poziomie nie 0,05 ale 0,1, to mina może nieco zrzednąć, bo oto

    \[\chi{^2}{_{(0,1;1)}= 2,70554 \]

zachodzi warunek \chi{^2} \geqslant \chi{^2}{_{(0,1;1)} zatem odrzucamy H_0 na rzecz jednostronnej hipotezy alternatywnej o wpływie radonu-222 na indukcję nowotworu płuc. Prawdopodobieństwo, że badacz nie myli się wydając taki sąd wynosi 90%.

Sebastian Żywicki

_____________________________________________
W opracowaniach epidemiologiczno-statystycznych wykorzystujemy niektóre elementy warsztatu metodologicznego

Saint LouisInstitute for Biosecurity Saint Louis University College for Public Health&Social Justice

 

John HopkinsJohn Hopkins Bloomberg School of Public Health