BMJ Magyar Kiadás 2000;4:251-2.

ÖSSZEFOGLALÓ KÖZLEMÉNYEK

Statisztikai alapkérdések: Az esélyhányados

J. Martin Bland, Douglas G. Altman

 

Napjainkban egyre szélesebb körben alkalmazzák az esélyhányados fogalmát az orvosi közleményekben, valószínű, hogy előfordul ilyen cikk a BMJ jelen számában is. Az esélyhányados népszerűségének három fő oka van. Először is: az esélyhányados (és megbízhatósági tartománya) alkalmas két bináris (igen-nem típusú) változó közti kapcsolat számszerűsítésére. Másodszor: segítségével megvizsgálhatjuk a többi változó hatását az előbb említett kapcsolatra, logisztikus regresszióval. Harmadszor pedig: eset-kontroll vizsgálatok esetén az esélyhányados különösen jól értelmezhető (ezzel a kérdéssel majd egy későbbi statisztikai jegyzetben foglalkozunk).

Aki kicsit is járatos a fogadások területén, az jól ismeri az esély fogalmát, amely lényegében a valószínűség egyik kifejezési módja. Annak esélye például, hogy a kockával egyszeri próbálkozással hatost dobjunk, 1 az 5-höz, vagyis 1/5. Az esély az esemény bekövetkezése valószínűségének és be nem következése valószínűségének hányadosa. Ezt gyakran úgy becsüljük meg, hogy a bekövetkezés gyakoriságát elosztjuk a be nem következés gyakoriságával. A táblázat 11 éves gyerekek szénanáthájának és ekzemájának előfordulását mutatja be egy keresztmetszeti vizsgálat adatai alapján (1). Annak becsült valószínűsége, hogy egy gyermeknek egyidejűleg ekzemája és szénanáthája is van, 141/561 (25,1%). Az ebből számolt esély 141/420. Hasonlóan, az ekzemában nem szenvedő gyerekek esetén a szénanátha előfordulásának becsült valószínűsége 928/ 14 453 (6,4%) és az esély 928/13 525. Az előbbi két gyermekcsoportot többféleképpen is összehasonlíthatjuk: az arányok közti különbséggel, 141/ 561–928/ 14 453=0,187 (azaz 18,7%); az arányok hányadosával, (141/561)/(928/14 453)=3,91 (ezt szokták relatív kockázatnak nevezni); vagy az esélyhányadossal (141/ 420)/(928/13 525)=4,89.

A szénanátha és az ekzema közti összefüggés 11 éves gyerekek esetében (1)

 Szénanátha 
 
 
EkzemaIgenNemÖsszesen
Igen141420561
Nem92813 52514 453
Összesen106913 94515 522

Tegyük fel most másképp a kérdést: mi a valószínűsége annak, hogy egy szénanáthában szenvedő gyereknek ekzemája is legyen? Az arány 141/1069 (13,2%) és az esély 141/928. A szénanáthában nem szenvedő gyerekek körében ugyanez az arány 420/ 13 945 (3,0%) és az esély 420/13 525. Az így kapott arányokat összehasonlítva a különbség 141/1069–420/ 13 945=0,102 (vagy másképpen 10,2%); az arány (a relatív kockázat) (141/1069)/(420/13 945)=4,38; az esélyhányados pedig (141/928)/(420/13 525)=4,89. Akárhogy tesszük is fel tehát a kérdést, az esélyhányados ugyanannyi marad, míg az arányok különbsége és hányadosa változik. Könnyű rájönni, miért van ez így. A két esélyhányados:

és mindkét tört a következő alakra hozható:

Ha a kategóriák sorrendjét megváltoztatjuk a táblázat soraiban és oszlopaiban, az esélyhányados nem változik. Ha csak az oszlopok vagy csak a sorok sorrendjét változtatjuk, akkor a korábbi esélyhányados reciprokát kapjuk, azaz 1/4,89=0,204-et. Többek közt ez az a tulajdonság, amely miatt az esélyhányados a kapcsolatok erősségének annyira könnyen használható mértékszámává vált.

A minta esélyhányadosának alulról van korlátja, mivel nem lehet negatív, felülről azonban nincs, tehát eloszlása ferde. Az esélyhányados logaritmusa (2) azonban bármilyen értéket felvehet és közelítőleg normális eloszlású. Ráadásul azzal az igen hasznos tulajdonsággal is rendelkezik, hogy ha felcseréljük valamely változó kategóriáinak sorrendjét, csak az esélyhányados logaritmusának előjelét kell megváltoztatnunk: log(4,89)=1,59 log(0,204)= –1,59.

Kiszámíthatjuk az esélyhányados standard hibáját (SH), ebből pedig a megbízhatósági tartományát. Az esélyhányados (EH) logaritmusának standard hibája egyszerűen a négy gyakoriság reciprokának összege a négyzetgyök alatt. Példánkban:

Az esélyhányados logaritmusának 95%-os megbízhatósági tartományát ábrázolva, a végpontok a becsült esélyhányados két oldalán vannak, az attól mért távolságuk pedig a standard hiba 1,96-szorosa. Előbbi példánkban az esélyhányados logaritmusa loge(4,89) =1,588 és a megbízhatósági tartomány végpontjai 1,588±1,9×0,103, vagyis 1,386 és 1,790. Ha magának az esélyhányadosnak (2) a 95%-os megbízhatósági tartományát akarjuk kifejezni, akkor az előző határok antilogaritmusát számítjuk ki, azaz exp(1,386)=4,00 és exp(1,790)=5,99 a végpontok. A megfigyelt esélyhányados, 4,89 nincs a megbízhatósági tartomány középpontjábann, mert az nem szimmetrikus a logaritmikus transzformáció miatt. Ezért az esélyhányadosok ábrázolásnál gyakran logaritmikus tengelyfelosztást alkalmaznak. Ha két változó közt semmilyen összefüggés nincs, akkor esélyhányadosuk 1. Azt a hipotézist, hogy az esélyhányados egyenlő 1-gyel, a szokásos khi2-próbával ellenőrizhetjük.

Minden hasznossága ellenére az esélyhányados néha nehezen értelmezhető (3). A későbbiekben majd ismertetjük a körülötte kialakult vitákat, valamint a logisztikus regresszióban és az eset-kontroll vizsgálatokban játszott szerepét.


  1. Strachan DP, Butland BK, Anderson HR. Incidence and prognosis of asthma and wheezing illness from early childhood to age 33 in a national British cohort. BMJ 1996;312:1195-9.
  2. Bland JM, Altman DG. Transforming data. BMJ 1996;312:770.
  3. Sackett DL, Deeks JJ, Altman DG. Down with odds ratios! Evidence-Based Med 1996;1:164-6.


Department of Public Health Sciences, St. George’s Hospital Medical School, London SW17 0RE
J. Martin Bland, professor of medical statistics

ICRF Medical Statistics Group, Centre for Statistics in Medicine, Institute of Health Sciences, Oxford OX3 7LF
Douglas G. Altman, professor of statistics in medicine

Correspondence to: Professor Bland.

BMJ 2000;320:1468.