Vissza a TÁRKI nyitóoldalára
TÁRKI logó Közvélemény- és piackutatás Adatbank Társadalomkutatás Kiadványok Magunkról English

Kiadványok

Társadalmi Riport | Társadalompolitikai Tanulmányok | Műhelytanulmányok, gyorsjelentések | Szerepváltozások | Könyvek munkatársainktól | Munkatársak publikációi | Kiadványrendelés

 

Rudas Tamás: Hogyan olvassunk közvélemény-kutatásokat?

2. Kit képviselnek a megkérdezettek? (Reprezentativitás)

A reprezentativitás a közvélemény-kutatások mintáinak legkívánatosabb tulajdonsága. Egyes közvélemény-kutató cégek azt állítják saját mintáikról, hogy azok „reprezentatívak”, mások csak annyit, hogy mintáik valamilyen szempontokból jól reprezentálják a vizsgálni kívánt sokaságot. Természetesen a közvélemény-kutatás céljaira egy olyan minta lenne a jó, amely a vizsgálni kívánt változó szerint reprezentatív. Ha például arra vagyunk kíváncsiak, hogy egy bizonyos politikai párt a szavazatok hány százalékát kapná, ha most tartanák a választásokat, akkor egy olyan minta lenne jó, amelyben a párt szavazóinak aránya megegyezik a párt szavazóinak a populációbeli arányával. Amennyiben a párt az összes szavazat 14%-át kapná, akkor olyan mintára lenne szükségünk, amelyben a párt szavazóinak aránya szintén 14%. Ha például a közvélemény-kutatás 1000 fő megkérdezésén alapul, azaz a mintanagyság 1000, akkor egy olyan minta lenne jó számunkra, amelyben a párt szavazóinak száma 140. Ebből a mintából a párt szavazóinak arányára olyan becslést kapnánk (140/1000=14%), amely megegyezik a populációbeli értékkel. A vizsgált párt szavazóinak száma vagy aránya szempontjából ez a minta reprezentatív lenne, mert pontosan tükrözné a populációbeli arányokat.

Sajnálatos módon, azt sohasem tudhatjuk, hogy a mintánk a minket érdeklő szempontból reprezentatív-e. Ennek eldöntéséhez a mintában tapasztalt értéket össze kellene hasonlítani a populációra jellemző értékekkel. A populációra jellemző értékek azonban nem ismeretesek. Ha ezeket az értékeket ismernénk, például tudnánk egy párt szavazóinak arányát az összes szavazó között, akkor a vizsgálatra nem is lenne szükség. A közvélemény-kutatás mindig olyan témáról szól, amellyel kapcsolatban a lakosság álláspontja nem ismert kellő pontossággal, ezért az sem eldönthető, hogy a vizsgálat alapjául szolgáló minta reprezentatív-e.

Más a helyzet olyan jellemzőkkel, amelyek a Központi Statisztikai Hivatal által gyűjtött adatok alapján jól ismertek. Ilyenek például a felnőtt népesség megoszlása nemek szerint, az iskolai végzettség különböző szintjei szerint vagy pedig a Budapesten, egyéb városokban, illetve községekben lakók aránya. Ezeknek az információknak a forrása a tízévenkénti népszámlálás, és a közbülső időben végrehajtott mikrocenzus. A mikrocenzus ugyan nem teljes körű adatfelvétel, de még mindig olyan nagy mintán végzett és megbízható adatgyűjtés, hogy eredményei a közvélemény-kutatások számára viszonyítási alapként szolgálhatnak. Ezen változók szempontjából a minta reprezentativitása ellenörizhető és szerencsés esetben megállapítható (ha a mintabeli érték nem tér el túlságosan a populációra jellemző értéktől).

Könnyen előfordulhat, hogy a minta valamely szempontból reprezentatív, de egy más szempont szerint már nem az. Egy mintát akkor nevezhetnénk minden további nélkül reprezentatívnak, ha valamennyi, a vizsgálatban feltett kérdés szerint reprezentálná a teljes populációt. Azt, hogy a reprezentativitás teljesül-e, éppen a legfontosabb (a kutatás tárgyát képező) változók szempontjából lehetetlen ellenőrizni. Ezért ebben az általános értelemben reprezentatív mintáról nem beszélhetünk. A minta mindig csak bizonyos változók szerint lehet reprezentatív. A vizsgálat tárgyát képező változó(K) szempontjából a reprezentativitás kérdése nem dönthető el.

Ennek illusztrálására képzeljünk el egy egész pici országot, amelyben csak tíz szavazásra jogosult él (ez a populáció), közülük öt nő és öt férfi. Tegyük fel még azt is, hogy a választáson, amelynek eredményét szeretnénk előre jelezni, csak két párt indul, A és B. A nők közül egy szavaz az A pártra, a férfiak közül pedig 4, a többiek a B pártra szavaznak. Eszerint a lakosság fele az A pártra szavazna, a lakosság fele a B pártra. Ez a valóság. De milyen eredménnyel járna egy közvélemény-kutatás? Ennek illusztrálására feltesszük, hogy minden megkérdezett válaszol szavazási szándékát firtató kérdésünkre, a megkérdezettek pártpreferenciái léteznek, azok határozottak és őszintén is válaszolnak. A valóságban természetesen ezek közül a feltevések közül egyetlen sem teljesül, de most csak a minták lehetséges tulajdonságait vizsgáljuk, és az egyéb problémákat későbbi fejezetekben tárgyaljuk.

Tegyük még fel, úgy döntünk, hogy a közvélemény-kutatást két fő megkérdezésére alapozzuk, azaz a mintanagyság kettő. Ki lehet számolni, hogy ebben az esetben negyvenöt darab különböző mintával találkozhatunk. (Bár annak belátása, hogy éppen 45 különböző minta lehetséges ebben az esetben, nem szükséges a továbbiak megértéséhez, bemutatjuk azt az egyszerű gondolatmenetet, amelyen ez az eredmény alapul. Válasszuk ki először az első személyt a mintából. Mivel a populációban 10-en vannak, a választás tízféle módon lehetséges. Akárkit is választottunk az első alkalommal, a második személy kiválasztására még 9 különböző lehetőség maradt, hiszen a 10 emberből egyet már kiválasztottunk. Így a két fő kiválasztására 10x9 = 90 lehetőség van. Ha azonban 90 lehetőségre gondolunk, akkor ebbe beleszámítottuk azt a mintavételt, amelynek során az első választás az x ember és a második választás az y ember, és egy másik mintavételként azt is, amelyben y az elsőként kiválasztott ember és x a másodszorra kiválasztott. Valójában ezek a választások ugyanarra a mintára vezettek, nevezetesen arra, amelyben x és y szerepel, függetlenül attól, hogy milyen sorrendben választottuk ki őket. Hasonlóan minden lehetséges mintát kétféle sorrendben választhatunk ki, és előbbi eredményünk, a 90 minden mintát kétszer tartalmaz. Tehát ténylegesen 90/2 = 45 különböző minta van. Megjegyezzük, hogy a későbbiekben ennél sokkal bonyolultabb számítások eredményeit közöljük majd anélkül, hogy utalnánk azokra a módszerekre, ahogy a közölt eredményeket megkaphatjuk.) Az, hogy a 45 lehetséges minta közül éppen melyiket választjuk, egy véletlentől függő eljáráson alapul és nem befolyásolható.

Az egész populáció, és valamennyi lehetséges minta is, egy úgynevezett 2x2-es táblázatba helyezhető. Ez a táblázat minden embert két szempontból csoportosít: a neme és a pártpreferenciája szerint. Ezekből a szempontokból az ország lakosságának megoszlását az 1. táblázat tartalmazza.

1. ábra

Az egyik lehetséges minta két férfiből áll, akik közül egy az A pártra, egy pedig a B pártra szavaz. A negyvenöt lehetséges mintából négy lesz ilyen. Egy ilyen mintából a pártpreferenciát helyesen becsülnénk (mert a minta fele szavazna az A pártra), tehát a pártpreferencia szempontjából ez a minta reprezentatív. Ugyanakkor a minta nem reprezentatív a nemek szerinti eloszlás szempontjából, mert csupa férfiból áll. Ez utóbbi tényt meg tudnánk állapítani a mintának a népszámlálás adataival való összehasonlításából, az előbbit nem.

Léteznek olyan minták is, amelyek csak a nemek szerinti megoszlást mutatják helyesen (például egy A-ra szavazó férfit és egy A-ra szavazó nőt tartalmaznak), valamint olyan minták, amelyek mindkét szempontból reprezentatívak vagy egyikből sem.

Az összes minta besorolható ezen szempontok szerint. A 2. táblázat azt mutatja, hogy a 45 lehetséges minta hogyan oszlik meg a reprezentativitás szempontjából.

2. ábra

Azt látjuk, hogy a 45 lehetséges minta közül 17 olyan, amely a nemek és a pártpreferencia szerint is reprezentatív, további 8 a pártpreferencia szerint reprezentatív, a nemek szerint nem. Ezen minták bármelyikét választjuk is, a pártpreferenciák előrejelzése helyes lesz. Vannak tehát olyan minták, amelyek a pártpreferenciák pontos előrejelzésére kitűnően használhatóak, annak ellenére, hogy a nemek szerinti megoszlás szempontjából torzítanak. A pártpreferenciák pontos előrejelzésének nem feltétele az, hogy a minta pontosan tükrözze a populáció nemek szerinti megoszlását. Ugyanakkor a nemek szerinti megoszlást pontosan reprezentáló 25 minta között 8 olyan van, amely a pártpreferenciák szerint nem reprezentatív.

Összefoglalóan megállapíthatjuk: egy ellenőrizhető szempont (nemek) szerinti megoszlásnak a pontos vagy pontatlan volta a mintában nem garantálja, hogy a minta a vizsgálat célja (pártpreferencia) szerint reprezentatív. Ezért nem megfelelőek azok a mintavételi eljárások, amelyek csak arra ügyelnek, hogy a mintában bizonyos társadalmi csoportok a populációbeli arányuknak megfelelően szerepeljenek (természetesen itt csak ellenőrizhető szempontokról lehet szó), de ezen belül a kérdezőbiztosokra bízzák a megkérdezettek kiválasztását. Az ilyen eljárásokat kvótás mintavételnek nevezik. Ezek olyan mintákat eredményeznek, amelyek néhány ellenőrizheto szempontból reprezentatívak, de ez nem jelent biztosítékot arra nézve, hogy a vizsgálat tárgyát képező szempontból is reprezentatívak lennének.

A valóságban a kvótás mintavételi eljárások rosszabb eredményeket adnak, mint azt a fentiek alapján hihetnénk. Gyakran lényeges torzításokhoz vezet az, hogy a kérdezőbiztosok, a megadott kereteken belül, maguk választják ki a megkérdezetteket. Ez azért van így, mert a kérdezőbiztosoknak könnyebb megkérdezniük bizonyos csoportok tagjait, mint másokat, s gyakran saját környezetükből választják ki a megkérdezetteket, ami torzításokhoz vezethet. Vagy például könnyen feltételezhető, hogy a rendszerint fiatal kérdezőbiztosok minden társadalmi csoportból a „fiatalosabbakat” fogják előnyben részesíteni, aminek egy politikai közvélemény-kutatás esetén jelentős torzító hatása lehet.

A kvótás mintavétel tehát – annak ellenére, hogy bizonyos ellenőrizhető szempontokból biztosítja a minta reprezentativitását – a vizsgálat tárgyát képező szempontokból gyakran torz mintát eredményez. Ez a torzítás a körülményektől függően többé vagy kevésbé fontos. Ha csak arra vagyunk kíváncsiak hogy ki nyeri a választásokat, és az egyik párt lényegesen népszerűbb, mint bármely másik párt, akkor ezt kissé torz minta alapján is pontosan előrejelezhetjük. Ha azonban az eredmény szoros, akkor már egy kissé torz minta alapján is tévedhetünk. Ezért kvótás mintavételt ma már általában nem használnak.

A kvótás mintavételi eljárás hiányossága úgy is megfogalmazható, hogy a kérdezőbiztosok által preferált társadalmi csoportok nagyobb mértékben kerülnek a mintába, mint az egyéb csoportok, még akkor is ha a csoportképző szempontok egy része – az előírt kvóta miatt – nem is torzul. Ezt úgy lehet kiküszöbölni, hogy a populáció minden tagjának egyforma esélyt adunk a mintába kerülésre. Az ezen az elven alapuló mintavételi eljárásokat véletlen mintavételnek nevezik.

A véletlen mintavétel legegyszerűbb formája egy olyan listát használ fel, amely a populáció minden egyedét tartalmazza. Közvélemény-kutatásoknál a vizsgált populáció emberekből áll, például a budapesti hajléktalanok, ha azt szeretnénk megtudni, hogy mennyire elégedettek bizonyos szociális ellátásokkal, vagy az összes szavazásra jogosult egy választási előrejelzésnél, vagy a város egy bizonyos területének összes lakója, ha a buszmegálló kívánatos elhelyezésének felderítése a cél vagy egy iskola tanulói, ha a legnépszerűbb tanárt akarjuk kiválasztani. Ezekben az esetekben a teljes populációt felsőroló lista előállítása különböző (csökkenő) mértékben nehéz feladat.

Az egyszerű véletlen mintavétel a populáció minden tagjának ugyanakkora esélyt ad a mintába kerülésre. Ha a minta nagysága előre rögzített és a populáció nagysága is ismert, akkor egy személy bekerülési valószínűsége e két szám hányadosa. Ha rendelkezünk egy teljes listával a populációról, akkor az egyszerű véletlen mintavételt úgy képzelhetjük el, hogy a populáció minden tagjának a nevét felírjuk egy papírlapra, ezeket belehelyezzük egy nagy dobozba, jól megkeverjük a cédulákat, és addig húzunk ki neveket (a már kihúzottak visszatevése nélkül), amíg el nem érjük a kívánt mintanagyságot. Ez a mintavételi eljárás azt is eredményezi, hogy rögzített mintanagyság mellett az összes lehetséges ekkora méretű minta azonos valószínűséggel kerül kiválasztásra.

A korábbi példában szereplő tízfős populáció esetén az egyszerű véletlen mintavételt úgy hajtanánk végre (kételemű mintákkal), hogy előbb kiválasztanánk egy személyt a tízből, és utána még egyet a fennmaradó kilencből. A mintába kerülő személyek kiválasztásánál azonban semmilyen szubjektív tényező sem játszhatna szerepet, kizárólag a pártatlan véletlen. Mint említettük, ebben az esetben 45 különböző kételemű minta lehetséges, és ezek mindegyike ugyanakkora valószínűséggel kerülne kiválasztásra. Ez azt jelenti, hogy ha például kilencezerszer vennénk mintát ebből a populációból, akkor várhatóan valamennyi mintát nagyjából kétszáz alkalommal választanánk.

Mit nyerünk, és mit veszítünk a véletlen mintavétel alkalmazásával? A véletlen mintavétel esetén az egyik veszteség annak a garanciának a hiánya, hogy a kapott minta akármilyen fontos jellemző szerint is reprezentatív legyen. Előfordulhat, hogy a minta torz még olyan alapvető szempontból is, mint a nemek szerinti megoszlás. További veszteségnek tűnhet az, hogy a véletlen mintavétel eredménye felett nem gyakorlunk kontrollt, „ki vagyunk szolgáltatva a véletlennek”. A véletlennek való kiszolgáltatottság azonban nem is olyan rossz. Mindenesetre sokkal jobb, mintha a kérdezőbiztosok, vagy a vizsgálat egyéb résztvevőinek önkéntelen preferenciái befolyásolnák a minta összetételét. A véletlen pártatlan és – legalábbis hosszú távon – kiegyensúlyozott mintaválasztást eredményez. Semmilyen mintavételi eljárás esetén sem tudjuk megmondani, hogy az aktuális minta reprezentatív-e a vizsgálandó szempontokból. Véletlen mintavétel esetén azt remélhetjük, hogy ez a reprezentativitás – hosszú távon és átlagosan – teljesül.

Az előző példánkban szereplő negyvenöt különböző kételemű minta közül huszonöt reprezentatív volt, azaz azt mutatják, hogy a szavazók fele az A pártra, másik fele pedig a B pártra szavaz. A fennmaradó húsz minta közül tízben mindenki az A pártra szavazna, tízben pedig mindenki a B pártra. Ha az összes mintából számítanánk ki az A pártra szavazók arányát, ötven százalékot kapnánk, hiszen (25x50%+10x100%+10x0%)/(25+10 +10)=50%. Ebből az is következik, hogy véletlen mintavétel esetén a mintából az A párt szavazóira kapható becslések átlaga a mintavételi és becslési eljárás sok alkalmazása után szintén 50% lesz. Átlagosan tehát helyesen fogjuk megbecsülni a két párt szavazóinak arányát.

Természetesen ez nem jelenti azt, hogy véletlen mintavétel esetén minden minta alapján pontos becslést adnánk. Azonban olyan mintát, amely alapján a becslés nagyon rossz lenne, ritkán kapunk. Kicsit pontosabban: minél jobban eltér egy mintában az A párt szavazóinak aránya a teljes népességen belüli arányuktól, annál kisebb valószínűséggel, annál ritkábban fogjuk ezt a mintát megfigyelni. Az a tendencia, hogy rossz becslést adó mintákat csak ritkán fogunk megfigyelni, sokkal erősebb, mint azt gondolnánk.

Ha például a párt szavazóinak aránya a népességben 50% és a mintanagyság 2500, akkor az összes lehetséges minta 68%-a annyira jó, hogy a párt szavazóinak aránya a mintában (és ezzel együtt a populációbeli arányukra vonatkozó becslésünk) 49% és 51% között lesz. Az összes 2500 személyt tartalmazó mintáknak a fennmaradó nagyjából egyharmad része egyformán oszlik meg olyan minták között, amelyekben a párt szavazóinak aránya több, mint 51%, és olyan minták között, amelyekben a párt szavazóinak aránya kisebb, mint 49 %. Más szavakkal: ha véletlenszerűen választunk egy 2500 elemű mintát, akkor az eseteknek több, mint kétharmad részében a mintánk annyira jó lesz, hogy a párt szavazóinak arányát illetően a mintára és a populációra jellemző értékek eltérése kisebb, mint 1 százalékpont. Csak a mintáknak kevesebb, mint egy harmada fog olyan becslést adni, amelynek hibája nagyobb, mint 1 százalékpont. Ezek az eredmények a véletlen mintákra vonatkozó matematikai megfontolásokból származnak. Ezeknek a jó tulajdonságoknak a teljesüléséhez nem kell mást tenni, mint a véletlen mintaválasztás szabályait betartani, és akkor „automatikusan” teljesülnek. Ugyanebben a helyzetben azon minták aránya, amelyekből a párt szavazóinak arányát 48% és 52% közé tennénk, 95% lenne, azaz húsz minta közül tizenkilenc esetében legfeljebb két százalékpontot tévednénk. Azon minták aránya, amelyben legfeljebb három százalékpontot tévednénk, azaz a pártra szavazók becsült aránya 47% és 53% között lenne, az összes lehetséges minták 99,7%-a. Ez azt jelenti, hogy 300 mintaválasztás közül mindössze egy lenne annyira balszerencsés, hogy három százalékpontnál nagyobb hibát eredményezne.

Tehát a véletlen mintavételen alapuló eljárások nagy biztonsággal olyan mintákat eredményeznek, amelyekből egy párt szavazóinak arányát kis hibával meg lehet becsülni. Természeten a fenti eredmények matematikaiak, és csak megszorítással alkalmazhatóak a valóságra. Azt kell feltennünk, hogy a népességben mindenkinek van határozott pártpreferenciája; a mintát valóban egyszerű véletlen mintavétellel választották ki; mindenki válaszolt, aki eredetileg a mintába került; és mindenki őszintén válaszolt. Ezen szempontok közül valamennyi szerint jónak kell lennie a közvélemény-kutatásnak ahhoz, hogy a fenti – igen kedvező – eredmények a pontosságra vonatkozóan akár csak közelítőleg is igazak legyenek. Ez azt mutatja, hogy egy közvélemény-kutatás minőségének, és ezen keresztül az eredmények érvényességének és megbízhatóságának a megítéléséhez számos részlettel kell tisztában lennünk.

Összefoglalás

A véletlen mintavétel átlagosan pontos, és megfelelő mintanagyság mellett az esetek többségében egyedileg is igen pontos becsléseket tesz lehetővé.

A véletlen minták az esetek többségében jól reprezentálják a népességet a vizsgált szempontból; Ennek nem feltétele az, hogy a minta valamely ellenőrizhető szempontból reprezentatív legyen.

Azt, hogy egy minta jó-e, nem lehet eldönteni. Egy mintát akkor tekintünk jónak, ha helyes módszerrel választották.

Ne higgyünk azoknak a közvélemény-kutatásoknak, amelyek készítői azt állítják, hogy mintájuk „reprezentatív”. Ezek a kutatók összekeverik vágyaikat a tényekkel.


Társadalmi Riport | Társadalompolitikai Tanulmányok | Műhelytanulmányok, gyorsjelentések | Szerepváltozások | Könyvek munkatársainktól | Munkatársak publikációi | Kiadványrendelés