Statystyk
Realizacja ALGORYTMU BADANIA KLINICZNO-KONTROLNE – symulacja
etap 1 ustalenie liczebności w grupach
próba statystyczna I – osoby z rozpoznanym nowotworem płuc: 529
próba statystyczna II – osoby zdrowe: 493 (grupa kontrolna)
etap 2 wykonanie badań dozymetrycznych w obu grupach
Ujawnienie występowania czynnika ryzyka – Dozymetria Rn-222 w miejscach zamieszkania osób z obu prób
TABELA KONTYNGENCJI
zmienna objaśniana (Y) |
||||
wystąpienie zmian |
brak zmian |
suma |
||
X |
Rn-222 TAK |
480 |
400 |
880 |
Rn-222 NIE |
49 |
93 |
142 |
|
suma |
529 |
493 |
1022 |
etap 3 określenie ilorazu szans (OR) [odds ratio]
Wniosek: Ekspozycja na badany czynnik Rn-222 jest blisko 2,3 razy częstsza wśród osób, u których diagnozuje się nowotwór płuc niż wśród osób zdrowych.
etap 4 ustalenie przedziału ufności (CI) dla ilorazu szans (OR)
95% przedział ufności OR (w zapisie skrótowym 95% CI OR)
poziom istotności α = 1-0,95= 0,05
Wartość Z zaczerpnięto z tabeli wartości krytycznych rozkładu normalnego np. http://www.mathsisfun.com lub ewentualnie – dla dużych prób – z tabeli wartości krytycznych rozkładu t-Studenta)
OR = 2,28
ln(OR) = 0,8242
Wariancja ln(OR)
Błąd standardowy logarytmu naturalnego OR
Górna 95% granica ln(OR) = = 1,19562
Dolna 95% granica ln(OR) = = 0,45278
Górna granica OR = exp(górna granica ln(OR)) = 3,31
Dolna granica OR = exp(dolna granica ln(OR) = 1,57
W profesjonalnej literaturze przedmiotu zamiast powyższego wprowadzenia znajdziesz jedynie poniższy zapis
OR= 2,28; 95% CI 1,57 3,31
Przedział zawiera OR oraz nie zawiera wartości 1 stąd wnioskujemy, że występuje istotna istotna statystycznie różnica pomiędzy obiema grupami. (wartość OR=1 wskazywałaby brak związku, a wartości OR mniejsze od 1 wskazywałaby zależność odwrotną) SSebastian Żywicki
Sebastian Żywicki Szczecin
Testowanie hipotezy – test zgodności chi-kwadrat Pearsona
hipoteza zerowa H0: hipoteza zerowa H0: „nie ma różnic jakości powietrza wewnętrznego ze względu na Rn-222 w miejscach zamieszkania osób chorych i osób zdrowych”
Wynik eksperymentu:
Tabela kontyngencji
zmienna objaśniana (Y) |
||||
wystąpienie zmian |
brak zmian |
suma |
||
X |
Rn-222 TAK |
480 |
400 |
880 |
Rn-222 NIE |
49 |
93 |
142 |
|
suma |
529 |
493 |
1022 |
Do testowania hipotezy zerowej można wykorzystać surowe formuły matematyczne
lub skorzystać ze sprawdzonego szablonu (gdzie wartości poszczególnych komórek tabeli mają swoje miejsce w poniższym równaniu)
Dla założonego przedziału ufności 95% poziom istotności wynosi 0,05. Poziom istotności to wartość prawdopodobieństwa przyjęcia hipotezy zerowej podczas gdy w rzeczywistości jest ona fałszywa. W przedstawionej tabeli liczba stopni swobody wynosi df =1 {(liczba kolumn-1)·(liczba wierszy-1) a wartość statystyki wynosi:
Wartość statystyki odnajdziesz z łatwością np tu: http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_chi-kwadrat
Jeżeli to odrzucamy na rzecz hipotezy alternatywnej
Jeżeli to przyjmujemy (nie ma podstaw do odrzucenia)
Porównanie wartości testu z wartością krytyczną każe odrzucić hipotezę zerową o braku związku.
Odrzucasz zatem H0 przyjmując hipotezę alternatywną H1 mówiącą o „istnieniu różnic jakości powietrza wewnętrznego ze względu na zawartość Rn-222 w miejscach zamieszkania osób chorych w porównaniu z jakością powietrza wewnętrznego w miejscach zamieszkania osób zdrowych”. Hipotezę przyjmujesz z prawdopodobieństwem popełnienia błędu wnioskowania 0,05.
Dalsze badania nad hipotezą alternatywną skutkują domniemaniem, że trudno ją obalić również dla poziomu istotności 0,001
a to oznacza, że badacz ma rację w odniesieniu do swojego wniosku z prawdopodobieństwem wyższym niż 99,9%
_____________________________________________
W opracowaniach epidemiologiczno-statystycznych wykorzystujemy niektóre elementy warsztatu metodologicznego
Institute for Biosecurity Saint Louis University College for Public Health&Social Justice