Definicja problemu niedostępności oraz konsekwencje tego zjawiska dla wyników badań

5/5 - (3 votes)

W tym fragmencie [pracy mgr] zagadnienie niedostępności będzie przedstawione z perspektywy teoretycznej i praktycznej.

Pierwsza część skupia się na definicji problemu niedostępności i umiejscowieniu go w kontekście błędów spotykanych w badaniach sondażowych. Wraz z kilkoma teoretycznymi modelami, przedstawione zostaną konsekwencje występowania niedostępności dla rezultatów badań. Druga część skupi się na prezentacji miar niedostępności i jakości danych. Końcowa część omówi strategie analizy różnic między jednostkami dostępnymi a niedostępnymi. Istotność tego typu badań polega na możliwości odpowiadania na pytania dotyczące losowego lub systematycznego charakteru niedostępności. Dodatkowo, przedstawione zostaną trzy przypadki badań dotyczących jednostek niedostępnych, reprezentujące dwie strategie badawcze w tym zakresie.

Błąd powiązany z występowaniem jednostek niedostępnych – błąd braku odpowiedzi – ma miejsce, gdy wybrana jednostka nie bierze udziału w badaniu z różnych powodów, jest niedostępna (unit nonresponse). Drugi typ błędu braku odpowiedzi to sytuacja, w której respondent nie udziela odpowiedzi na pojedyncze pytanie (item nonresponse) – brakuje nam pojedynczego wskaźnika. Niniejsza praca koncentruje się wyłącznie na pierwszym typie błędu – jednostkach niedostępnych.

Niedostępność wpływa na każde badanie sondażowe, niezależnie od tego, czy jest ono kompleksowe, oparte na losowej lub kwotowej próbie. Zastosowanie jednak doboru probabilistycznego lub kompleksowego badania umożliwia lepszą ocenę skali zjawiska i potencjalnych konsekwencji. Możliwości pomiaru niedostępności w badaniach opartych na próbach celowych są znacznie bardziej ograniczone, istnieją jednak narzędzia umożliwiające taki pomiar. Kwestia pomiaru skali zjawiska niedostępności w badaniach zostanie poruszona w dalszej części rozdziału.

Przyczyny, dla których osoby wybrane do próby nie biorą udziału w badaniu, są bardzo zróżnicowane. Niedostępność może wynikać z przyczyn zupełnie losowych, na przykład gdy wybrana osoba musi opuścić miejsce realizacji badania z powodów służbowych czy rodzinnych. Innym przykładem losowego charakteru niedostępności są tzw. „puste” lub „błędne” adresy (Grzeszkiewicz-Radulska 2001).

Niedostępność może być jednak również wynikiem przyczyn nielosowych. Tak jest, gdy określona grupa nie uczestniczy w badaniu z przewidywalnych powodów. Na przykład, ankieterzy mogą odwiedzać respondentów tylko w godzinach pracy, pomijając inne pory dnia. W rezultacie, większość osób pracujących poza domem będzie niedoreprezentowana, a osoby bezrobotne, gospodynie domowe i emeryci będą nadreprezentowani. Innym przykładem jest grupa jednorodna pod względem społeczno-demograficznym, która z różnych powodów konsekwentnie odmawia udziału w badaniach. W obu przypadkach mamy do czynienia z niedoreprezentacją pewnych grup i zakłóceniem wyników badania, które odzwierciedlają jedynie badaną część rzeczywistości. Do problemu grup niedostępnych powrócimy w kolejnych rozdziałach.

Występowanie zjawiska niedostępności może prowadzić do błędów we wnioskowaniu na podstawie zgromadzonych danych. Z drugiej strony, nie zawsze jednostki niedostępne prowadzą do zniekształceń w danych. To, czy wyniki będą obarczone błędem, a także jaki to będzie błąd, zależy od przyczyn niedostępności.

Aby zrozumieć konsekwencje niedostępności niektórych jednostek dla danych, warto przeanalizować przykładowe badanie, w którym użyto prostego losowego doboru próby. Celem jest oszacowanie średniej pewnej zmiennej. Rozważmy dwie sytuacje, w których przyczyny niedostępności mają charakter losowy lub systematyczny.

W pierwszej sytuacji, gdy braki w próbie są losowe, można przyjąć założenie, że osoby, które nie wzięły udziału w badaniu, nie różnią się istotnie od uczestników. To oznacza, że średnia szacowanej zmiennej jest taka sama wśród osób dostępnych i niedostępnych. Pominięcie jednostek niedostępnych przy wnioskowaniu z zebranych danych powoduje tylko zwiększenie błędu standardowego średniej z próby.

W drugiej sytuacji, gdy braki w próbie są wynikiem błędów systematycznych, założenie o braku różnic między uczestnikami badania a osobami niedostępnymi nie jest uprawnione. Z dużym prawdopodobieństwem średnie szacowanej zmiennej dla osób dostępnych i niedostępnych są różne. Występowanie niedostępności powoduje, że wyniki badania są obarczone błędem systematycznym, którego nie da się przewidzieć tak jak błędu standardowego estymatora. Wielkość tego błędu zależy od różnicy między średnimi wśród jednostek dostępnych i niedostępnych, a także od proporcji osób niedostępnych w założonej próbie.

Powyższe sytuacje to oczywiście modele idealne. Zazwyczaj w badaniu przyczyny niedostępności mają zarówno charakter losowy, jak i systematyczny. Dlatego ważne jest gromadzenie informacji o osobach, które nie uczestniczą w badaniu – przynajmniej o przyczynach ich niedostępności. Ta wiedza pozwala ocenić, na ile wyniki badania mogą być obarczone błędem systematycznym.


Grzeszkiewicz-Radulska, Katarzyna (2001), Jednostki niedostępne w sondażach CBOS, [w:] Paweł Daniłowicz, Zygmunt Gostkowski, Sondaże opinii społecznej: samowiedza współczesnych społeczeństw. Analizy i próby technik badawczych w socjologii, t. X, IFiS PAN.

Lissowski, Grzegorz (1971), Problem jednostek niedostępnych w reprezentacyjnych badaniach socjologicznych, [w:] K. Szaniawski (red.) „Metody matematyczne w socjologii”, Ossolineum, Wrocław.

Lessler, Judith T., William D. Kalsbeek (1992), Nonsampling errors in surveys, Wiley, New York.

Dodaj komentarz