Statystyk

Realizacja ALGORYTMu BADANIA KOHORTOWEGO – symulacja
Typ: badanie retrospektywne* Sebastian Żywicki
* badanie, w którym efekt końcowy (ujawnienie nowotworu płuc) wystąpił przed rozpoczęciem badania
etap 1 Ustalenie liczebności w grupach
próba statystyczna I – osoby narażone na działanie czynnika (Rn-222): 529
próba statystyczna II – osoby nie narażone na działanie czynnika (Rn-222): 512
etap 2 Rejestracja zmian nowotworowych w obu próbach, w okresie ostatnich 10 lat
TABELA KONTYNGENCJI
|
zmienna objaśniana (Y) |
||||
|
wystąpienie zmian |
brak zmian |
suma |
||
|
X |
osoby narażone |
14 |
515 |
529 |
|
osoby nie narażone |
6 |
506 |
512 |
|
|
suma |
20 |
1021 |
1041 |
|
etap 3 zapadalność w obu grupach
Osoby narażone na działanie Rn-222 (ekspozycja na czynnik; inhalacja Rn-222)
![]()
Zachorowalność w grupie ryzyka wynosi 2,646%
![]()
Zachorowalność w grupie bez czynnika wynosi 1,172%
etap 4 kalkulacja ryzyka względnego RR (RW, HR [hazard risk])
![]()
Relatywna zmiana ryzyka zachorowania wynosi 2,26 i oznacza, że osoby podlegające oddziaływaniu radonu są ponad dwukrotnie bardziej narażone na raka płuc aniżeli osoby nie narażone.
etap 5 kalkulacja ryzyka przypisanego ekspozycji
![]()
etap 6 określenie ilorazu szans (OR) [odds ratio]
![]()
Jako że OR>1, to czynnik może stanowić przyczynę pojawienia się choroby.
etap 7 ustalenie przedziału ufności (CI) dla ryzyka względnego
95% przedział ufności OR (w zapisie skrótowym 95% CI RR)
poziom istotności α = 1-0,95= 0,05
![]()
Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com/data/standard-normal-distribution-table.html lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
RR= 2,26
ln(RR)=0,8153
Wariancja ln(RR)
![]()
Błąd standardowy logarytmu naturalnego RR
![]()
Górna 95% granica ln(RR) = 0,8153+1,96*0,4860 = 1,7679
Dolna 95% granica ln(RR) = 0,8153-1,96*0,4860= -0,1373
Górna granica RR = exp(górna granica ln(RR)) = 5,86
Dolna granica RR = exp(dolna granica ln(RR) = 0,87
W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
RR= 2,26; 95% CI 0,87 5,86
Przedział zawiera wartość RR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji. Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość RR leży w dużej odległości od 1.
etap 8 ustalenie przedziału ufności (CI) dla ilorazu szans (OR)
95% przedział ufności OR (w zapisie skrótowym 95% CI OR)
poziom istotności α = 1-0,95= 0,05
![]()
Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
OR= 2,29
ln(OR)=0,8285
Wariancja ln(OR)
![]()
Błąd standardowy logarytmu naturalnego OR
![]()
Górna 95% granica ln(OR) = 0,8285+1,96*0,5097 = 1,7600
Dolna 95% granica ln(OR) = 0,8285-1,96*0,5097= -0,1705
Górna granica OR = exp(górna granica ln(OR)) = 6,21
Dolna granica OR = exp(dolna granica ln(OR) = 0,84
W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
OR= 2,29; 95% CI 0,84 6,21
Przedział zawiera wartość OR stąd wnioskujemy, że występuje istotna różnica pomiędzy grupą poddaną ekspozycji na Rn-222 i grupą nie poddaną tej ekspozycji.
Przejściową wątpliwość może rodzić fakt, że przedział zawiera wartość 1 czyli brak związku – niemniej jednak proszę zwrócić uwagę na to, że wartość OR leży w dużej odległości od 1. Sebastian Żywicki
Sebastian Żywicki Szczecin
Testowanie alternatywne
test zgodności chi-kwadrat Pearsona
Testowanie hipotezy o braku związku pomiędzy podwyższonym poziomem Rn-222 i zapadalnością na nowotwór płuc
hipoteza zerowa H0: „nie ma różnic w zachorowalności na nowotwór płuc pomiędzy grupą poddawaną ekspozycji na Rn-222 i grupą nie poddawaną ekspozycji”
Wynik eksperymentu:
TABELA KONTYNGENCJI
|
zmienna objaśniana (Y) |
||||
|
wystąpienie zmian |
brak zmian |
suma |
||
|
X |
osoby narażone |
14 |
515 |
529 |
|
osoby nie narażone |
6 |
506 |
512 |
|
|
suma |
20 |
1021 |
1041 |
|
Do testowania hipotezy zerowej można wykorzystać surowe formuły matematyczne
![Rendered by QuickLaTeX.com \[\Huge{\chi{^2}}= \sum_{i=1}^{r} \sum_{j=1}^{k} \frac{(n_{ij}-\hat{n}_{ij})^2}{\hat{n}_{ij}}\]](http://radon-szczecin.pl/wp-content/ql-cache/quicklatex.com-a8b7bb609889d12ac74bcba411032804_l3.png)
![]()
lub skorzystać ze sprawdzonego szablonu (gdzie wartości poszczególnych komórek tabeli mają swoje miejsce w poniższym równaniu)
![]()
Dla założonego przedziału ufności 95% poziom istotności wynosi 0,05. Poziom istotności to wartość prawdopodobieństwa przyjęcia hipotezy zerowej podczas gdy w rzeczywistości jest ona fałszywa. W przedstawionej tabeli liczba stopni swobody wynosi df =1 {(liczba kolumn-1)·(liczba wierszy-1) a wartość statystyki wynosi:
![]()
Wartość statystyki odnajdziesz z łatwością np tu: http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_chi-kwadrat
Jeżeli
to odrzucamy
na rzecz hipotezy alternatywnej
Jeżeli
to przyjmujemy
(nie ma podstaw do odrzucenia)
W przypadku tej symulacji, z radością przyjmujemy hipotezę
, mówiącą o braku zależności pomiędzy ekspozycją i skutkiem, z prawdopodobieństwem wyższym niż 0,95.
Zwróć jednak uwagę, że gdyby badacz dopuścił możliwość popełnienia błędu na poziomie nie 0,05 ale 0,1, to mina może nieco zrzednąć, bo oto
![]()
zachodzi warunek
zatem odrzucamy
na rzecz jednostronnej hipotezy alternatywnej o wpływie radonu-222 na indukcję nowotworu płuc. Prawdopodobieństwo, że badacz nie myli się wydając taki sąd wynosi 90%.
Sebastian Żywicki
_____________________________________________
W opracowaniach epidemiologiczno-statystycznych wykorzystujemy niektóre elementy warsztatu metodologicznego
Institute for Biosecurity Saint Louis University College for Public Health&Social Justice
John Hopkins Bloomberg School of Public Health
