|
|
LAM 2001;11 (5): 377-383
"A statisztikai eljárások végrehajtása bonyolult képletek megértését és ezt követően kényelmetlen, fáradságos számítások elvégzését jelenti. Különösen igaz ez a leghasznosabbnak tűnő, a kísérleti hipotézisre közvetlen választ adó statisztikai próbákra."
Ez a vélekedés - legalábbis az orvosok közt - meglehetősen általános, és nagyjából egyet is lehet érteni vele. Még csak azt sem mondhatjuk, hogy az említett nehézségek tartják vissza őket - az orvosokat - attól, hogy a statisztikai módszereket kellő mértékben alkalmazzák kutatómunkájukban. A számítások elvégzése végül is nem az ő feladatuk (erre valók a számítógépek, és egy kis segítséget sem nehéz találni), a képletek mondanivalóját pedig minek megérteniük, hiszen azokkal semmi dolguk.
A fenti, túlságosan is sommás vélemény ellensúlyozása a célunk, amikor néhány olyan egyszerű, ám hasznos eljárást mutatunk be, amelyekhez nemcsak számítógép nem kell, de mindenki maga is el tudja őket végezni. Általában nem árt, ha kéznél van egy - előszeretettel "kalkulátornak" nevezett - közönséges zsebszámológép, de olyan módszer is van, amihez még ez sem kell.
Induljunk ki abból, hogy gyakran csak kevés adatunk van. Egyelőre nem fogalmazzuk meg, hogy mennyi ez a "kevés", mivel esetről esetre változik, hogy mi az a legkisebb elemszám1, amivel már szabad, és mekkora az a szám, ameddig kényelmesen lehet alkalmazni az eljárást, idegen segítség igénybevétele nélkül.
Ez az "idegen segítség" nem feltétlenül a gép. Ha például az a feladat, hogy a + előjeleket számoljuk össze (éppen ezt kell tennünk a bemutatásra kerülő első példában!), akkor 10-20, vagy akár 40 jel között is hajlandók vagyunk megkeresni azokat. De ha már 100 jelet kell végigböngészni, akkor a kutatóorvos - ugyanaz, aki a mikroszkópon át egy ültő helyében több ezer sejtet zokszó nélkül néz végig - "idegen segítséget" vesz igénybe, és az asszisztenssel számoltatja össze a +-okat. Nem mintha nem tudná - csak rühelli. (Ahogyan én rühelleném a sejtek végignézését.)
Sokféle oka lehet annak, hogy (ma, a "tömeggyártás" korában) kevés adatot kell kiértékelnünk. Lehet a vizsgálat tárgya olyan, hogy már 8-10 adat összegyűjtése is sokba - sok pénzbe vagy sok időbe, ami manapság majdnem ugyanaz - kerül. Gyakran van ez így bizonyos laboratóriumi, például kísérleti állatokkal végzett vizsgálatoknál. De lehet az az ok, hogy kevés olyan beteg volt, akinél a vizsgálat tárgyát képező kezelést el kellett (el lehetett) végezni, és sok időbe telne, míg egy nagyobb csoport (nagyobb minta) összegyűlik. Vagy az is lehet, hogy egy nagyszabású vizsgálatot készülünk végezni, és szeretnénk előzetesen egy kis mintán tájékozódni. (Gyakran nevezik az ilyet előkísérletnek.) Végül az is előfordulhat, hogy szándék, lehetőség, cél, minden egybevág, és egyszerűen ekkora mintát vizsgálunk, mert...
Lássuk ezek után a szóba
jöhető eljárásokat!
Előjelpróba
Az előjelpróba2, mint a neve is mutatja, statisztikai próba; az ilyet - tudjuk - valamilyen hipotézis ellenőrzésére szokás használni. A hipotézis ezúttal az, hogy valamilyen szer vagy beavatkozás hatására megnő egy bizonyos érték. Ez az érték lehet a vérnyomás, a pulzusszám, egy bizonyos anyag koncentrációja (például a vérben, de másutt is), és még sok minden más. Akármi, amit - in vivo - mérni lehet.
De nemcsak emberen (vagy kísérleti állaton) végzett mérésre gondolhatunk. A "beavatkozást" végezhetjük egy Petri-csészében vagy egy lombikban, a "szert" hozzátölthetjük egy oldathoz, egy preparátumhoz, egy sejttenyészethez. Ami "megnő", az lehet valamilyen koncentráció, a sejtszaporodás sebessége, az elhalás mértéke stb.
Mi az, ezzel szemben, ami korlátozza a módszer alkalmazhatóságát? Az, hogy az előjelpróba önkontrollos vizsgálatokra alkalmas, vagyis olyanokra, ahol a beavatkozás előtti és utáni értéket ugyanazon az egyeden (személyen, kísérleti állaton) mértük3. Erre pedig nem mindig nyílik lehetőség.
Három eset fordulhat elő: a vizsgált érték a beavatkozás után nagyobb, kisebb, esetleg ugyanakkora; eléggé magától értetődő módon a +, -, illetve 0 jelekkel szokás ezeket szimbolizálni.
Megjegyezzük, hogy "nagyon pontos" mérés esetén egyformát szinte soha nem kapunk. Ezek a "nagyon pontos", sok tizedesjegyű értékek azonban gyakran úgyis csak műtermékek: nem a biológiai valóság, hanem a számolási hókuszpókusz szolgáltatja őket. Célszerű, ha - biológiai kritériumok alapján - valamilyen határt (küszöbszámot) állapítunk meg előzetesen, amelyen belül változatlannak tekintjük az értéket - mintegy azt állítva ezzel, hogy a látszólagos különbség oka a mérési bizonytalanság. Szisztolés vérnyomás esetén például 5 Hgmm lehet ez a határ, de persze választhatunk más küszöbszámot is.
Lássuk ezek után az előjelpróba
végrehajtását! Az adatokat célszerű táblázatos
formában összegezni úgy, ahogy az alábbi, szám
nélküli(!) példa mutatja (1. táblázat).
Az "esetek" (mintaelemek) sorrendje a próbában teljesen közömbös;
számozásuk csupán az elemszám megállapítására
szolgál.
1. táblázat. Példa
- számok nélkül
![]() |
A táblázatban nem adtuk meg az adatokat; azokkal semmi dolgunk nem lesz. Az utolsó oszlopba plusz jelet írtunk oda, ahol a második szám nagyobb (az érték nőtt), mínuszt, ahol csökkent, és nullát változatlanság esetén. (Figyelembe véve az esetleges küszöbszámot.)
A hipotézis az, hogy a beavatkozás
(szer) hatásos: megváltoztatja a vizsgált
értéket. Ha növeli, a +-ok lesznek túlsúlyban,
ha csökkenti, a - -ok. (A nullhipotézis4:
nincs tendenciózus változás; minden előforduló
növekedés és csökkenés csupán a véletlen
műve.) Nincs más dolgunk, mint összeszámlálni
ezeket a jeleket, és a végeredményt az előjelpróba
táblázatából (2. táblázat)
kikeresni.
2. táblázat. Az előjelpróba
táblázata. Az előjelek elméleti eloszlásához
tartozó valószínűségek
![]() |
De mi legyen a nullákkal? A szóban forgó esetek (személyek, tárgyak, sejttenyészetek) nem adtak információt a hipotézisre vonatkozóan, azok tehát olyanok, mintha nem is lennének! A tennivalók nyelvére lefordítva ez azt jelenti, hogy elhagyjuk a változatlanokat, ezzel csökkentve mintánk elemszámát. Példánkban tehát nem 25, hanem 21 az érvényes elemszám: ennél az értéknél kell a táblázatot megvizsgálni.
Előbb azonban számláljuk meg az előjeleket! Azt találjuk, hogy 15 + és mindössze 6 - előjel van az 1. táblázatban, vagyis (mondjuk) 15 személy esetében emelte a szer (beavatkozás) a vizsgált értéket, 6 személynél viszont csökkentette.
A 2. táblázatban álló számok azt adják meg, hogy legfeljebb mennyi lehet a kevesebbszer előforduló előjelből ahhoz, hogy az eredmény a fejlécen található szinten "szignifikáns" legyen. (Az idézőjellel arra akartunk utalni, hogy ez nem feltétlenül jelent a szokásos értelemben vett szignifikanciát. Hiszen 20% - p=0,20 - leolvasása esetén aligha fogja bárki is "szignifikánsnak" minősíteni eredményét.) A jelenlegi elemszámunknak megfelelő 21-es sorban azt látjuk, hogy eredményünk a szokásos, 5%-os szinten nem szignifikáns, a 10%-os szinten azonban igen. (El ne felejtsük: a táblázatban álló számot a mínusz előjelek számával kell egybevetnünk.)
A 2. táblázat fejlécében
álló valószínűségek mellett azonban
ott található a "kétoldali" jelző, amelylyel
az 1999-es LAM-sorozatban nem találkoztunk5.
Ennek magyarázatával (és a próbavégzésre
vonatkozó következményeivel) kicsit részletesebben
kell foglalkoznunk.
Egyoldali és kétoldali statisztikai próbák
Előre bocsátjuk, hogy
mindaz, amit mondunk, nem korlátozódik az előjelpróbára.
Nagyon sok statisztikai próba, így például
a közismert t-próba is, végezhető "egyoldali"
és "kétoldali" módon6.
[Megjegyezzük, hogy az idézett cikksorozatban (1) mindig kétoldali
próbavégzésről volt szó, ezért
lehetett e megkülönböztetés említését
elkerülni.]
![]() (Az eltérést szignifikánsnak mondjuk, ha a nulla körüli eloszlás "levágott" részébe esik.) |
Emlékeztetünk a statisztikai próbák felépítésére: a nullhipotézisnek megfelelő eloszlás végéből le kellett vágni a szignifikanciaszintnek megfelelő (például 5%-os nagyságú) területet7. Ezt az eloszlás két végén, megosztva vágtuk le (1. ábra), mert a nullhipotézis ("nincs hatás, az értékek változatlanok") ellentétét automatikusan úgy fogalmaztuk meg, hogy "van hatás, az értékek megváltoznak".
A hipotéziseket azonban másképp is felállíthatjuk. Számok és szöveg nélküli példánk hipotézisének megfogalmazása ez volt: "valamilyen szer vagy beavatkozás hatására megnő egy bizonyos érték". Nem volt véletlen. Nemcsak azért történt, mert ezt az egyoldali/kétoldali megkülönböztetést akartam a példával illusztrálni, hanem mert a gyakorlatban nagyon sokszor ez a természetes hozzáállás. Ha egy vérnyomáscsökkentő szer hatását vizsgálom, nem az a hipotézisem, hogy változtatja a szer a páciensek vérnyomását, hanem az, hogy csökkenti a vérnyomást. Vagyis egyoldali hipotézist fogalmazok meg.
Úgy is mondhatnám, hogy "a lehetséges esetek egyik fele nem érdekel". Ha egy vérnyomáscsökkentő nem csökkenti a vérnyomást, akkor erre a célra biztosan alkalmatlan. Nem érdekel, hogy esetleg kiderülhet: szignifikánsan emeli a vérnyomást. Akkor talán igen, ha a vérnyomás befolyásolhatóságát vagy szabályozásának mechanizmusát vizsgálom. De ha a vérnyomáscsökkentők közt akarok válogatni (vagy az új készítményeket tesztelni), akkor elég annyit tudni: ezek a szerek csökkentik, amazok nem csökkentik a vérnyomást.
Számtalan ehhez hasonló eset van; szinte azt mondhatnánk: a gyógyszerek többsége ilyen. De nem csak a gyógyszerektől: más beavatkozásoktól is legtöbbször egyirányú megváltozást (kicsit leegyszerűsítve: gyógyulást) várunk. A most tárgyalt statisztikai "ügyeskedés" (aminek az előnyét még nem látjuk, hiszen el sem mondtuk eddig az eljárást!) ellenzői azt szokták mondani, hogy jogtalan az egyoldali hipotézis fölállítása, hiszen - különösen a biológiában - soha nem tudhatjuk előre, egy új beavatkozás hogyan, milyen irányban fog hatni. Ez igaz; de az előbbi példák mutatják, hogy sok olyan eset van, amikor ugyan nem "tudjuk", milyen irányú lesz a hatás, de a "másik" irány - a dolgok természete folytán - egyszerűen nem érdekel.
Joggal kérdi az olvasó, milyen előnyünk származik abból, ha csak ezt az egyik, célunknak megfelelő változást vesszük tekintetbe? Nézzük meg ismét az 1. ábrát. Ha a csökkenések8 nem érdekelnek, még esetleges "szignifikanciájukat" sem akarjuk kimutatni; így az első fajta hiba elkövetésének kockázatát csak az eloszlás egyik, a megnövekedett értékeknek megfelelő végén kell vállalni. A szemlélethez közelebbi megfogalmazással: a teljes 5%-ot az eloszlás egyik végéből vágjuk le (lásd a szaggatott vonalat az 1. ábrán!), és így "hamarabb", kisebb növekedéseknél is ki tudjuk mondani a növekedés valódiságát, szignifikanciáját.
Ez a helyzet a korábban vizsgált példa esetében is. A táblázatban álló valószínűségeket felezni kell, hiszen ha (mondjuk) 10%-ot vágunk le az eloszlás két végéből, az annyit jelent, hogy egy-egy végéből éppen 5%-ot vágtunk le. A talált 6 negatív előjel "túl sok" volt, amikor - automatikusan - kétoldali próbát végeztünk. De ha eredeti hipotézisünknek megfelelően csak a növekedés szignifikáns voltára vagyunk kíváncsiak, a 6 fölött álló p=0,10-et úgy kell "olvasnunk": 0,05. Az eredmény tehát szignifikáns az 5%-os szinten.
Az eljárás mindig ugyanez. A próba számolása (a képlet, a behelyettesítés) nem változik, akár egyoldali, akár kétoldali próbát végzünk. Eltérés mindössze két ponton van. Az egyik a hipotézis, amit előre meg kell fogalmazni. Sokan azért ellenzik az egyoldali próbákat, mert azt állítják, hogy sok szerző, ha nem kap szignifikáns eredményt, gyorsan egyoldalivá alakítja a próbát, amikor is - mint láttuk - az eredmény könnyebben lesz szignifikáns.
Ezt az érvelést nem tudom elfogadni. Ha egy kutató csalni akar (mert kár tagadni: ilyen is van!), akkor nem kell ilyen kicsinyes eszközökhöz folyamodnia. Megváltoztathatja adatait is, hogy "kijöjjön" a várt eredmény - sőt az egész kísérletet kár elvégeznie (micsoda fölösleges kínlódás! "hebehurgya, véres munka", ahogy Hamlet anyja mondta): egyszerűen "megírja" az egészet az íróasztalnál, elkerülve a laboratóriumi kínlódást és a biológiai változékonyság fricskáit. ("Ekkora szórás mellett soha nem lesz szignifikáns az eredmény, pedig biztosan igaz az állítás!")
A hipotézist tehát előre kell megfogalmazni - de hát ez minden esetben így van. A "nézzük meg, mi jött ki, és annak alapján fogalmazzuk meg fiziológiai feltevéseinket; valami csak változik, ha ennyi mindent beadtunk az állatnak!" jellegű "kísérletezés" nem érdemel szót. (Meg sem merem kérdezni: előfordul manapság is?) Ha előre felállított hipotézisekből indulunk ki, az egyoldali próba ugyanolyan kifogástalan, mint a kétoldali. Bővebb érvelés, pró és kontra, számos statisztikai munkában található; például (2, 3). Armitage (4) ellenzi az egyoldali próbákat, gyakorlati szempontok alapján, Kendall (5) viszont kimutatja, hogy elméleti szempontból jobbak a kétoldaliaknál.
A nagy vita közben elmaradt az eljárás leírásának befejezése. Mint mondtuk, az egyik különbség egy- és kétoldali próbák közt a hipotézis megfogalmazásában van, a másik - és erről csak a példa kapcsán volt szó - a táblázat használatában. (Ha számítógéppel végzünk valamilyen próbát, akkor a valószínűség kiszámítását kell mondanunk táblázathasználat helyett.) Az eljárás egyszerű: felezni kell a táblázatban álló valószínűségeket, és úgy kell őket leolvasni9. Könnyen látszik így az is, hogy az egyoldali próba "hamarabb" szignifikáns, mint a kétoldali: ha a kiszámított értékhez (mondjuk egy t-hez) tartozó valószínűség 5 és 10% közé esne kétoldali próba esetén, akkor az 2,5 és 5% közé esik egyoldali próbavégzéskor. Ugyanaz az érték tehát így szignifikáns, amúgy pedig nem. (Ez volt a helyzet az előbbi példában is.)
A gyakran használt statisztikai próbák közt sok olyan van, amelyeknél nincs értelme az egyoldali/kétoldali megkülönböztetésnek. Említsünk meg néhányat ezek közül!
A varianciaanalízis különböző fajtái mind ilyenek. Vegyük például az egyszempontos varianciaanalízist, amelyik több, egymástól független minta átlagát hasonlítja össze. A minták közti mindenféle eltérés az egyformaság cáfolata; értelmetlen arról beszélni, hogy a "másik" (melyik a sok közül?) nagyobb vagy kisebb. A próbavégzéshez szükséges F-táblázatok viszont egyoldaliak: az első fajta hiba az eloszlás egyik végéből - a nagy F értékek közül - van levágva. Mert ugyan mit is mondhatna nekünk egy olyan kicsi F (vagyis olyan kis eltérés az egyes minták közt), amelyik "szignifikánsan" kisebb annál, mint amit a véletlen folytán elvárnánk? Nehezen lehetne értelmezni az ilyet - de nincs is rá szükség. A csoportok eltérésére vagyunk kíváncsiak, nem arra, hogy mennyire egyformák.
Hasonló a helyzet a megállapítható
adatok elemzésekor használt khi2-próbák
(és a khi2-táblázat) esetében is.
A részletekkel fölösleges lenne az olvasót fárasztani.
Az előjelpróba befejezése
Visszatérve az előjelpróbára, a 2. táblázatból leolvashatjuk azt is, hogy melyik az a legkisebb elemszám, amikor már lehet (és érdemes) a próbát használni. A táblázat eleve a 6-os elemszámnál kezdődik: ha mintánk elemszáma ennél kisebb (vagy ha a nullák elhagyása után ez alá csökken!), akkor ne is fogjunk hozzá10. De alacsonyabb szinteken (0,02, 0,01) a 6-os, 7-es elemszám sem elég; erre utalnak a táblázatban álló vonalak.
Annak, hogy milyen nagy elemszámokig használhatjuk a próbát, inkább a célszerűség, mint a táblázatok mérete szab határt. Túl sok előjelet pontosan összeszámlálni nehezebb, mint hinnénk! (Jó ellenőrzési módszer, ha nemcsak azt számoljuk meg, amelyikből kevés van, hanem a "többségieket" is.) Az itt közölt, 50-es elemszámig használható táblázatnál részletesebb táblázatot talál az érdeklődő az irodalomban; például (6, 7). Sok könyv azonban még az 50-es elemszámot is "soknak" tartja, mondván, hogy nagy mintákra jó közelítéseket dolgoztak ki, amelyek az előjelek számát a normális eloszlásba transzformálják. Ehhez azonban már "képlet" kell és "bonyolult számolás", tehát nem képezheti ennek a dolgozatnak a tárgyát.
Vagy mégis?
Mi is volt ez a cél? A megváltozások vizsgálata anélkül, hogy azok nagyságára (számértékére) kíváncsiak lettünk volna. De hiszen ugyanezt vizsgálta a négymezős táblázatból számolt, az idézett helyen számpéldával együtt tárgyalt McNemar-próba is! Idézzük föl röviden az ott elmondottak lényegét!
A mindössze két értéket
fölvevő, megállapítható (azaz teljesen
általános, számértékkel sem rendelkező)
változó két értékét a + és
- szimbólumokkal jelöltük. A 684. oldal első oszlopában
tárgyalt próba azon az önkontrollos11
elrendezésen alapult, hogy a személyeket a "beavatkozás"
előtt és után is "megvizsgáltuk" (vagyis megkérdeztük
őket). A kapott eredményt a következő alakú
négymezős táblázatba rendeztük (ahol a,
b, c és d a megfelelő cellákba kerülő
személyek számát jelentik):

Az "előtte +, utána -" állítás egyenértékű azzal (gondoljunk az előjelpróbára!), hogy csökkent az érték a beavatkozás hatására. Pontosan b esetben történt ez, tehát ha előjelpróbáról lenne szó, ennyi a - előjelek száma.
Hasonló megfontolással az "előtte -, utána +" állítás azt jelenti, hogy az érték nőtt; eszerint c a fenti négymezős táblázatnak megfelelő előjelpróbában a + előjelek száma.
És a másik két cella? Akinél a (kétértékű) változó előtte is, utána is + volt (a darab ilyen van), ott nincs változás: az előjelpróbában ezeket az eseteket jelöltük 0-val; és ugyanez a helyzet a változatlanul - értéket adó d számú személlyel. Az előjelpróbában ezeket egyszerűen elhagytuk, és egy (az eredetinél) kisebb, b+c elemű mintából számoltunk.
De nézzük csak meg a McNemar-próba képletét, amit a 684. oldalról (9. évfolyam) változatlan formában idemásoltunk! Eszerint:

Ebben sem szerepel a és d (vagyis a változatlanok száma), hanem csak a változásokat jelölő két másik érték - akárcsak az előjelpróbában. De a "rokonság" ennél szorosabb: a fenti képlet nem más, mint az előjelek számának imént említett, normális eloszlásba transzformált változata! Csak éppen négyzetre emelték a normális eloszlást, amit, ugye tudjuk12, 1 szabadságfokú khi2-eloszlásnak hívnak.
Bár "képletről"
és "számolásról" van szó, azok annyira
egyszerűek, hogy elképzelhető: valaki ezt akarja használni
előjelpróba helyett, ha nagy az elemszám. Éppen
ezért megadjuk az eredmény leolvasásához szükséges
khi2-értékek és a hozzájuk tartozó
valószínűségek táblázatát
is (3. táblázat). Nem más ez, mint a sok helyen
megtalálható khi2-táblázat első
sora; ebben az esetben ugyanis mindig 1 a szabadságfok. (Az
előjel csak + vagy - lehet; ha tudjuk, hány + van, a mínuszok
számát is ismerjük.)
3. táblázat. Az 1
szabadságfokú khi2-eloszlás táblázata
![]() Egyoldali hipotézis vizsgálata esetén a feltüntetett valószínűségeket felezni kell. |
Némi "magyarázkodásra" azért szükség van a próba egyoldali hipotézis esetén történő alkalmazásához. Mert bár a khi2-eloszlás egyik végéből levágott értékek szerepelnek a táblázatban (csak a nagy khi2-érték jelenthet eltérést, tehát szignifikanciát), a négyzetre emelés miatt mindkét irányú - pozitív és negatív - eltérés ugyanitt szerepel; következésképp a táblázatból kiolvasott valószínűségek a kétoldali próbához tartoznak.
Az elmondottakból következik, hogy mi a követendő eljárás. Mivel a khi2-eloszlásból "levágott" valószínűség a normális eloszlás két végének - egyforma nagyságú - valószínűségével egyenlő, ha minket csak a növekedések (vagy csak a csökkenések) érdekelnek, ezt a valószínűséget feleznünk kell. Mindez természetesen csak akkor érvényes, ha a változás a várt irányban következik be, tehát ha (a hipotézisben megfogalmazott) növekedés esetén c, csökkenés feltételezése esetén b a nagyobb. (A számolás után ez már nem derül ki: a különbség előjelét a négyzetre emelés "elmossa".) Amennyiben az ellenkező irányú változás - az ellenkező előjel - van túlsúlyban, sem felezett, sem duplázott, sem másféle valószínűséget nem kereshetünk ki a 3. táblázatból: a nullhipotézis (nincs növekedés, illetve nincs csökkenés) mellett kell döntenünk.
Számoljuk ki - mintegy játékból - eredeti példánkra vonatkozóan is ezt az utóbb bemutatott próbát! A feltétel13 teljesül, tehát a próba alkalmazható. A +-ok száma (lásd az 1. táblázatot!) c = 15, a negatív előjelek száma b = 6. A képletbe történő helyettesítés és a meglehetősen egyszerű számolás után khi2= 81/21 = 3,857 adódik. Ez pedig még kétoldali hipotézis felállítása esetén is szignifikáns: p<0,05. (A 3. táblázatban 5%-nál 3,841, tehát a kapott számnál kisebb érték áll. Ha egyoldali hipotézist állítunk fel a növekedések vizsgálatára, a 2,706-os khi2-értékhez kell hasonlítanunk a képletből kiszámított eredményt.)
A két próba eredménye eszerint némileg eltérő volt: előjelpróbát végezve a "kétoldalian megfogalmazott kérdésre"14 (van változás?) nemmel kellett felelnünk, és csak ha - egyoldali hipotézissel - a "megnő az érték?" kérdést fogalmaztuk meg (mint ezt eredetileg is tettük), akkor válaszolhattunk (a p=5%-os szignifikanciaszinten) igennel. Mármost akkor melyik a "jó" a két próba közül?
A válasz egyértelmű: az előjelpróba a jó (vagy mondjuk így: a jobb) eljárás. (Ráadásul az egyszerűbb is!) Pedig felületes szemlélő azt mondhatja: a khi2-eloszlás alapján számolt próba (McNemar-próba) a jobb, hiszen érzékenyebbnek bizonyult: az elvetni vágyott nullhipotézishez kisebb valószínűség tartozott - kevésbé valószínűen volt igaz -, mint amit az előjelpróba esetén kaptunk ugyanazokból az adatokból. Csakhogy...
Csakhogy az előjelpróba az elképzelt szituációhoz (vagy más szóval: a modellhez) tartozó pontos valószínűséget határozta meg15, a négymezős próba pedig közelítette az előjelek (diszkrét) eloszlását egy folytonos eloszlással (nevezetesen a normális eloszlással), és az ehhez tartozó valószínűségekkel dolgozott. Mint minden közelítés, ez is pontatlan. Ebben az esetben "lefelé", a kisebb valószínűségek irányába torzított (ezért látszott az újabb próba érzékenyebbnek), máskor azonban "fölfelé" torzít, és "kevésbé szignifikáns" eredményt ad a (pontosabb) előjelpróbánál.
Mindebből azonban az a legfontosabb tanulság a számunkra, hogy nem az a próba a "jó", amelyik az általunk várt, hőn óhajtott eredményt adja, hanem amelyik biztosabb "elméleti alapokon" áll. Pedig milyen jó lenne mindig azt választani, amelyik "kihozza" a kívánt eredményt! Nem akarok azonban a kutatói tisztesség és a (sajnos itt-ott előforduló) csalás kérdésébe ismét belemenni; a dolgozat második szakaszában elég szó esett erről.
Az előjelpróba annak köszönheti hallatlan egyszerűségét, hogy eloszlásmentes [lásd (1), 566. oldal] - de ebből fakad gyengesége is. Vegyük észre, hogy csak a létrejött változás irányával törődik, de avval, hogy ez a változás mekkora, egyáltalán nem16. Ezzel nemcsak információ vész el (ha a többségben levő növekedések nagyok, jóval több kis csökkenést képesek ellensúlyozni, mint egyébként), hanem eltorzulhat az eredmény is. (Például olyankor, ha - éppen ellenkezőleg - az a néhány csökkenés nagy mértékű, a növekedések meg, ha sokan vannak is, viszonylag aprók.)
Mindjárt sietek hozzátenni, hogy ennek ellenére az előjelpróba statisztikailag teljesen korrekt, és nem kell félni annak használatától. Minden módszer esetén fölvethető, hogy helyes volt-e annak választása - ami főként azon múlik, hogy a választott modell mennyire közelíti meg azt a valóságos helyzetet, amelyre alkalmazzuk. Ez pedig nagyon sok szempontból vizsgálható, és lehet, hogy (például) a változások mértéke nem is tartozik a lényeges szempontok közé. Olyan esetekben, amikor a mérés bizonytalan, az előjelpróba - hasonlóan a többi eloszlásmentes eljáráshoz - nagyon is ajánlható módszer.
De nem csak olyankor! A hasonló szituációkban - a megváltozás tesztelése mérési adatokból - "legnépszerűbb" eljárás, az egymintás t-próba a mérési adatok normális eloszlását követeli meg. Nem lehetetlen, hogy a próba látszólagos érzékenységét, minden egyes változás nagyságának figyelembevételét drágán fizetteti meg velünk (félrevezető eredménnyel), ha megsértjük a feltételt, és nem normális, hanem valamilyen más eloszlás esetén alkalmazzuk. Az előjelpróbánál - lévén az eloszlásmentes - semmi ilyentől nem kell tartanunk.
Mindvégig önkontrollos vizsgálatról, megváltozásról esett szó. Az előjelpróba azonban - hasonlón "társaihoz", az egymintás t-próbához és a Wilcoxon-próbához [lásd (1), 566. oldal, vagy részletesebben (2), 357-359. oldalak] - sok más esetben is alkalmazható. Például amikor két, páronként öszszetartozó (vagy összekapcsolt) mintát vizsgálunk, és a különbséget ezekre az összetartozó párokra (angolul matched pairs) külön-külön számítjuk ki, majd - hiszen előjelpróbát számolunk - meghatározzuk a különbségek előjelét. Ennek részleteibe sem mehetünk itt bele, de utalunk a 3. jegyzetre, ahol tulajdonképpen ezt az esetet "előlegeztük".
A dolgozat következő, II.
részében az 1999-es cikksorozatban (568. oldal) lényegében
csak említett Kendall-féle rangkorrelációs
együtthatóról lesz szó, és egy egyszerű
eljárásról annak ellenőrzésére,
hogy valóban "véletlen" (random) mintánk van-e, vagy
elrontja azt valamilyen torzító hatás.
Jegyzetek
Irodalom