Statystyk
Realizacja ALGORYTMu BADANIA KOHORTOWEGO – symulacja
Typ: badanie retrospektywne* Sebastian Żywicki
* badanie, w którym efekt końcowy (ujawnienie nowotworu płuc) wystąpił przed rozpoczęciem badania
etap 1 Ustalenie liczebności w grupach
próba statystyczna I – osoby narażone na działanie czynnika (Rn-222): 529
próba statystyczna II – osoby nie narażone na działanie czynnika (Rn-222): 512
etap 2 Rejestracja zmian nowotworowych w obu próbach, w okresie ostatnich 10 lat
TABELA KONTYNGENCJI
zmienna objaśniana (Y) |
||||
wystąpienie zmian |
brak zmian |
suma |
||
X |
osoby narażone |
14 |
515 |
529 |
osoby nie narażone |
6 |
506 |
512 |
|
suma |
20 |
1021 |
1041 |
etap 3 zapadalność w obu grupach
Osoby narażone na działanie Rn-222 (ekspozycja na czynnik; inhalacja Rn-222)
Zachorowalność w grupie ryzyka wynosi 2,646%
Zachorowalność w grupie bez czynnika wynosi 1,172%
etap 4 kalkulacja ryzyka względnego RR (RW, HR [hazard risk])
Relatywna zmiana ryzyka zachorowania wynosi 2,26 i oznacza, że osoby podlegające oddziaływaniu radonu są ponad dwukrotnie bardziej narażone na raka płuc aniżeli osoby nie narażone.
etap 5 kalkulacja ryzyka przypisanego ekspozycji
etap 6 określenie ilorazu szans (OR) [odds ratio]
Jako że OR>1, to czynnik może stanowić przyczynę pojawienia się choroby.
etap 7 ustalenie przedziału ufności (CI) dla ryzyka względnego
95% przedział ufności OR (w zapisie skrótowym 95% CI RR)
poziom istotności α = 1-0,95= 0,05
Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com/data/standard-normal-distribution-table.html lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
RR= 2,26
ln(RR)=0,8153
Wariancja ln(RR)
Błąd standardowy logarytmu naturalnego RR
Górna 95% granica ln(RR) = 0,8153+1,96*0,4860 = 1,7679
Dolna 95% granica ln(RR) = 0,8153-1,96*0,4860= -0,1373
Górna granica RR = exp(górna granica ln(RR)) = 5,86
Dolna granica RR = exp(dolna granica ln(RR) = 0,87
W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
RR= 2,26; 95% CI 0,87 5,86
Przedział zawiera wartość RR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji. Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość RR leży w dużej odległości od 1.
etap 8 ustalenie przedziału ufności (CI) dla ilorazu szans (OR)
95% przedział ufności OR (w zapisie skrótowym 95% CI OR)
poziom istotności α = 1-0,95= 0,05
Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
OR= 2,29
ln(OR)=0,8285
Wariancja ln(OR)
Błąd standardowy logarytmu naturalnego OR
Górna 95% granica ln(OR) = 0,8285+1,96*0,5097 = 1,7600
Dolna 95% granica ln(OR) = 0,8285-1,96*0,5097= -0,1705
Górna granica OR = exp(górna granica ln(OR)) = 6,21
Dolna granica OR = exp(dolna granica ln(OR) = 0,84
W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
OR= 2,29; 95% CI 0,84 6,21
Przedział zawiera wartość OR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji.
Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość OR leży w dużej odległości od 1. Sebastian Żywicki
Sebastian Żywicki Szczecin
Testowanie alternatywne
test zgodności chi-kwadrat Pearsona
Testowanie hipotezy o braku związku pomiędzy podwyższonym poziomem Rn-222 i zapadalnością na nowotwór płuc
hipoteza zerowa H0: „nie ma różnic w zachorowalności na nowotwór płuc pomiędzy grupą poddawaną ekspozycji na Rn-222 i grupą nie poddawaną ekspozycji”
Wynik eksperymentu:
TABELA KONTYNGENCJI
zmienna objaśniana (Y) |
||||
wystąpienie zmian |
brak zmian |
suma |
||
X |
osoby narażone |
14 |
515 |
529 |
osoby nie narażone |
6 |
506 |
512 |
|
suma |
20 |
1021 |
1041 |
Do testowania hipotezy zerowej można wykorzystać surowe formuły matematyczne
lub skorzystać ze sprawdzonego szablonu (gdzie wartości poszczególnych komórek tabeli mają swoje miejsce w poniższym równaniu)
Dla założonego przedziału ufności 95% poziom istotności wynosi 0,05. Poziom istotności to wartość prawdopodobieństwa przyjęcia hipotezy zerowej podczas gdy w rzeczywistości jest ona fałszywa. W przedstawionej tabeli liczba stopni swobody wynosi df =1 {(liczba kolumn-1)·(liczba wierszy-1) a wartość statystyki wynosi:
Wartość statystyki odnajdziesz z łatwością np tu: http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_chi-kwadrat
Jeżeli to odrzucamy na rzecz hipotezy alternatywnej
Jeżeli to przyjmujemy (nie ma podstaw do odrzucenia)
W przypadku tej symulacji, z radością przyjmujemy hipotezę , mówiącą o braku zależności pomiędzy ekspozycją i skutkiem, z prawdopodobieństwem wyższym niż 0,95.
Zwróć jednak uwagę, że gdyby badacz dopuścił możliwość popełnienia błędu na poziomie nie 0,05 ale 0,1, to mina może nieco zrzednąć, bo oto
zachodzi warunek zatem odrzucamy na rzecz jednostronnej hipotezy alternatywnej o wpływie radonu-222 na indukcję nowotworu płuc. Prawdopodobieństwo, że badacz nie myli się wydając taki sąd wynosi 90%.
Sebastian Żywicki
_____________________________________________
W opracowaniach epidemiologiczno-statystycznych wykorzystujemy niektóre elementy warsztatu metodologicznego
Institute for Biosecurity Saint Louis University College for Public Health&Social Justice
John Hopkins Bloomberg School of Public Health