![]() |
![]() |
![]() |
BMJ Magyar Kiadás 2001;3:175-80.
ÖSSZEFOGLALÓ KÖZLEMÉNYEK
Barátkozzunk a statisztikával: A bizonyítékok rostája, avagy mi a baj a szignifikanciapróbákkal?
Jonathan A. C. Sterne, George Davey Smith
Az orvosi kutatások eredményeit gyakran szkepticizmussal fogadják, néha akkor is, ha a kutatás módszertana helyes és a statisztikai elemzés is megfelelő. Kiváltképpen igaz ez az epidemiológiai vizsgálatok esetében, amelyek a mindennapi élet valamely egészségre káros jelenségét tárják fel. James Le Fanu nemrég megjelent nagy sikerű könyvében (A modern orvoslás tündöklése és bukása a könyvről írt recenziót lásd legutóbbi számunk 119. oldalán) egészen addig megy el, hogy kijelenti: az orvoslás mostani betegségeire a legjobb gyógyír az epidemiológiai központok bezárása lenne (1).
Ennek egyik oka, hogy az orvosi irodalom erősen hajlik a pozitív eredmények hangsúlyozására; az eredményes vizsgálatokról gyakrabban írnak, mint azokról, amelyek nem hoznak előremutató eredményt (24). Így aztán egy sereg olyan felfedezést közölnek, mely csupán a véletlen műve, hiszen a hagyományos gondolkodásmód szerinti p=0,05 szinten szignifikáns eredmény 20 alkalomból egyszer a véletlen folytán is bekövetkezik. S mert csak a pozitív eredményeket közlik, azokat mindjárt jelentős felfedezésnek tekintik, figyelmen kívül hagyva, hogy a statisztikai szignifikancián alapuló megítélés magában hordozza a véletlen okozta pozitív eredményeket is. Mivel sok olyan vizsgálat van, mely hosszú kérdőívekből áll és több száz változóra vonatkozó információt tartalmaz, a meglehetősen nagyszámú álpozitív eredmény kimutatása már-már szavatolt. Mindezek ellenére nem állíthatjuk, hogy a kutatások számos gyakran egymásnak ellentmondó (5) eredménye pusztán a publikációs torzítás következménye. Ennél lényegesebb probléma a statisztikai szignifikancia fogalmának félreértése.
Az alábbiakban leírjuk, hogyan alakult ki a szignifikanciavizsgálat gyakorlata, és azt is, hogy a statisztikai következtetés alapelveit egykor kidolgozóknak nem állt szándékában az eredmények önkényes felosztása szignifikánsakra és nem szignifikánsakra (a közkedvelt p=0,05 küszöbszám alapján). A p-értéknek sokkal kisebbnek kell lennie 0,05-nál ahhoz, hogy valóban komoly bizonyítéknak tekinthessük a nullhipotézis ellen; ez pedig azt jelenti, hogy nagyobb statisztikai erejű vizsgálatokra van szükség. Az orvosi kutatások eredményközlésének el kell mozdulnia a szignifikáns-nem szignifikáns elvtől az eredményeknek a vizsgálat típusától függő és az egyéb létező bizonyítékokat is figyelembe vevő interpretálása felé. Az orvosi szaklapok szerkesztői kedvező módon befolyásolhatják a szemléletmód ilyen irányú változását, ezért cikkünket az eredményközlésre és interpretálásra vonatkozó útmutatóval zárjuk.
|
Összefoglalás
|
P-értékek és szignifikanciapróbák rövid történeti áttekintés
A hipotézisvizsgálat mai gyakorlatában tapasztalható zavar kezdete több mint 60 évvel ezelőttre, a statisztikai következtetés megalapozói közt kitört vita időpontjára nyúlik vissza (68). A szignifikanciapróba fogalmát R. A. Fisher vezette be. Képzeljük el például, hogy elemezni akarjuk, javítja-e egy új gyógyszer a myocardialis infarktus utáni túlélést. Két, egymással összehasonlítható csoportot vizsgálunk: az egyiket az új gyógyszerrel, a másikat placebóval kezeljük. Azt találjuk, hogy az új gyógyszerrel kezelt csoportban feleakkora a halálozási arány, mint a placebóval kezeltek körében. Ez mindenképpen biztató eredmény, de nem lehetséges-e, hogy csak a véletlen okozta? A kérdést a p-érték kiszámolásával tisztázzuk: mi a valószínűsége annak, hogy kétszeres túlélési arányt észleljünk abban az esetben, ha a gyógyszernek valójában semmi hatása nincs a túlélésre.
![]() |
Fisher a nullhipotézis ellen szóló bizonyíték erősségét mérő indexnek tekintette a p-értéket (a példában a nullhipotézis az, hogy az új gyógyszer nem befolyásolja a túlélést). A p<0,05 (5%-os szignifikanciaszint) küszöböt javasolta, mely alapján általában eldönthető, hogy van-e bizonyíték a vizsgált hipotézis ellen, de ezt nem gondolta abszolút mércének. Ha p 0,1 és 0,9 között van, akkor biztosan nincs okunk kételkedni a vizsgált hipotézisben. Ha az érték 0,02 alatt van, az elég erősen arra vall, hogy hipotézisünk nem elegendő magyarázat a tényekre. Talán nem tévedünk majd túl gyakran, ha a határvonalat 0,05-nál húzzuk meg... (9). Fontos itt megjegyeznünk, hogy Fisher mindig is hangsúlyozta: a p-érték interpretálása végső soron a kutató dolga. A 0,05 körüli p-értékkel előfordulhat, hogy nem a nullhipotézis elfogadásához vagy elvetéséhez vezet, hanem a vizsgálat megismétléséhez.
A fenti megközelítésben rejlő szubjektivitás iránti ellenszenv vezette Neymant és Pearsont a hipotézisvizsgálat megteremtéséhez, amely a p-értéknek, azaz a nullhipotézis elleni bizonyíték erősségének szubjektív megítélését objektív döntésen alapuló módszerrel volt hivatott felváltani (10). Neyman és Pearson azzal érvelt, hogy a kísérlet eredményének interpretálásakor kétféle hiba követhető el (1. táblázat). Fisher megközelítése az I. fajta hibára összpontosít. Ez a nullhipotézis elvetését (tehát annak elvetését, hogy az új szernek nincs hatása) jelenti akkor, amikor pedig valóban nincs neki. Neyman és Pearson a II. fajta hibát is fontosnak tartja: azt, hogy elfogadjuk a nullhipotézist (s mivel nincs hatása, elfelejtjük az új gyógyszert), mikor pedig a nullhipotézis valójában hamis (vagyis az új voltaképpen hatásos). Az I. és II. fajta hiba szintjének előzetes rögzítésével a különböző vizsgálatok során elkövetett hibák számát korlátozzuk. Ezek az elvek ismerősen csengenek azok számára, akik már alkalmazták a próba erejének fogalmát a szükséges mintaelemszám, a vizsgálatban részt vevők számának meghatározása során. Ezeknek a számításoknak a célja egy olyan mintaelemszám meghatározása, amely biztosítja, hogy mind az I., mind pedig a II. fajta hiba esélye kellően kicsi legyen.
| ||||||||||||
Neyman és Pearson szavai szerint nincs olyan próba, amely a valószínűségszámítást felhasználva önmagában elegendő bizonyítékot szolgáltatna egy hipotézis mellett vagy ellen. De nézhetjük a próbák célját más szemszögből is. Anélkül, hogy azt remélnénk, a próbákkal majd minden egyes esetben eldönthetjük, hogy a hipotézis igaz-e vagy hamis, találhatunk olyan vezérelveket, amelyek meghatározzák számunkra, hogyan álljunk a hipotézisekhez, hogy biztosítsuk: hoszszú távon nem tévedünk túl gyakran (10).
A NeymanPearson-elmélet szerint tehát előre elhatározunk egy döntési szabályt, eredményeink interpretálásához, így elemzésünk eredménye pusztán a nullhipotézis elfogadása vagy elvetése. Fisher szubjektív szemléletmódjával ellentétben Fisher egyébként egyáltalán nem értett egyet a NeymanPearson-elmélettel (11) nem teszünk kísérletet a p-értéknek a nullhipotézis elleni bizonyíték erősségeként való interpretációjára az egyes vizsgálatokban.
A NeymanPearson-elmélet alkalmazásakor előre rögzítenünk kell a pontos ellenhipotézist is. Vagyis nem elég annyit mondanunk, hogy a kezelés hatásos, hanem azt is meg kell mondanunk, hogy milyen mértékben például azt, hogy az új gyógyszer a halálozási arányt 60%-kal csökkenti. A kutató maga állíthatja fel a játékszabályokat: az ellenhipotézist, az I. és II. fajta hibát, de mindezt a vizsgálat elvégzése előtt kell megtennie. Sajnos a kutatók számára nehéz az ilyen elvek mentén dolgozni. A vizsgálat elvégzése előtt csak ritkán van elképzelésük az ellenhipotézisben szereplő kezelés hatásának nagyságáról (kivételt talán a fő hatásmutató képez a véletlen besorolásos klinikai vizsgálatokban). Ezért tehát a NeymanPearson-féle megközelítésnek csak a könnyebbik felét alkalmazzák széles körben azaz: elvethető a nullhipotézis, ha p<0,05 (5%-os I. fajta hiba). Innen eredeztethető az a téves nézet is, hogy a NeymanPearson-elmélet hasonlít Fisheréhez.
A gyakorlatban részben a gyógyszertörzskönyvezésre jogosult hatóságoknak és az orvosi szaklapoknak köszönhetően az orvosi statisztikában uralkodóvá vált az eredmények szignifikáns és nem szignifikáns kategóriába sorolása, tekintet nélkül a II. fajta hibára. Ennek gyakori és súlyos következménye, hogy a kis esetszámú vizsgálatokban klinikailag jelentős különbségek is elsikkadnak mint nem szignifikánsak, miközben minden szignifikáns különbség valódi hatásnak minősül.
Ezek a gyakran (1417) és régóta (13) emlegetett problémák vezettek ahhoz a sikeres kampányhoz, amelyben a megbízhatósági tartomány alkalmazását javasolták a p-érték helyett vagy annak kiegészítőjeként (1820). Mivel a megbízhatósági tartományok összehasonlításra is szolgálnak, kimozdíthatnak bennünket az elvetni-elfogadni mechanikus kettősségének gyakorlatából. Kis elemszámú vizsgálatok esetén eszünkbe juttathatják, hogy eredményeink alapján egyaránt elképzelhető a nullhipotézis, a kezelés erőteljes jótékony hatása, valamint a káros hatás is, sőt a kétféle hatás együttes jelenléte sem kizárt. A 0,05 körüli p-értékeknél kihangsúlyozzák, hogy a valódi hatás lehet jóval nagyobb, de jóval kisebb is, mint az aktuálisan becsült érték. A 95%-os megbízhatósági tartományok azonban valójában 5%-os szignifikanciaküszöböt is jelentenek, innen származik újabb félreértelmezésük, ha csak egyszerűen szignifikanciapróbának tekintik azokat (aszerint, hogy tartalmazzák-e a nullát vagy sem) ahelyett, hogy a populációk közti különbség értékeinek valószínű terjedelmeként fognák fel. Azt tanácsoljuk, hogy a kutató orvosok hagyjanak fel az 5%-os szignifikanciaszint szerepének túlbecslésével. Ezt többek közt úgy lehetne elterjeszteni széles körben, hogy a standard konfidenciaszintet nem a 95%-nál húznánk meg.
A p-érték és a szignifikanciapróbák félreértelmezése
A p-értékeket, sajnos, még mindig gyakran félreértelmezik. Legtöbbször azt a hibát követik el, hogy a nullhipotézis igaz voltának valószínűségeként fogják fel, tehát a szignifikáns eredmény azt jelenti, hogy a nullhipotézis elég valószínűtlen. Egy példán keresztül, két eléggé hihető feltételezés segítségével megmutatjuk, hogy miért félrevezető ez az értelmezés.
Először feltételezzük, hogy az esetek 10%-ában a nullhipotézis hamis ami azt jelenti, hogy a belőle kiinduló vizsgálati hipotézisek 90%-a sem igaz. Ez nagyjából egybevág az epidemiológiai irodalom adataival: 1985-ig a koszorúér-betegség 300 lehetséges kockázati tényezőjét azonosították, de feltételezhetően ezeknek csak kis része növeli valóban a betegség kockázatát (21). Második feltevésünk: mivel a vizsgálatokat gyakran kevés beteg közreműködésével végzik, a próbák ereje (=1a II. fajta hiba) kicsi, az átlaguk körülbelül 50%. Ez is egybecseng a vizsgálatok méretéről szóló közlemények eredményeivel (2224).
Képzeljük most el azt, hogy 1000 tanulmány hipotézisét vizsgáljuk, és elvetjük a nullhipotézist, ha p<0,05. Első feltevésünk alapján tudjuk, hogy a nullhipotézis 1000-ből 100 esetben hamis. Mivel a II. fajta hiba 50% (feltevésünk második pontja alapján), a nullhipotézist 100-ból 50 esetben vetjük el. A maradék 900 vizsgálatban, ahol a nullhipotézis igaz, elvetjük azt az esetek 5%-ában, azaz 45 esetben [2. táblázat, Oakes (25) alapján]. Abból a 95 vizsgálatból tehát, ahol az eredmény szignifikáns (vagyis p<0,05), 45-ben (47%) igaz a nullhipotézis, így ezek álpozitív eredmények; elvetettük a nullhipotézist, pedig nem kellett volna. Közvetlen párhuzamot vonhatunk a populációk szűrésére alkalmazott tesztekkel: ha a betegség (a hamis nullhipotézis) ritka, akkor csak a teszt specifikusságának magas értéke óvhatja meg a teszt által felderített valódi pozitív eseteket attól, hogy elvesszenek a rengeteg az illető betegségben nem szenvedő ember álpozitív eredménye közt (26). Előfordulhat, hogy egy szignifikáns (p<0,05) statisztikai próba pozitív prediktív értéke alacsony jelen esetben körülbelül 50%. Gyakori hiba, hogy azt gondolják, a pozitív prediktív érték 95%, mert a szignifikanciaszint 0,05.
|
A 2. táblázatban ábrázolt eredmények a bayesi elvek szellemét tükrözik. A kiindulópont egy à priori (bayesianus lásd Bayesianusok és frekventisták, BMJ Magyar Kiadás, 1999. 2. szám, 126. oldal a szerk.) meggyőződés a kezeléshatás lehetséges nagyságrendjéről, majd ezt a meggyőződést módosítjuk a mért adatok ismeretében. Az imént bayesi érvelést alkalmaztunk, mikor kimutattuk, hogy a szokásos p<0,05 küszöb nem jelent igazán súlyos bizonyítékot a nullhipotézis ellen (27, 28). Sok szerző sok-sok éven át állította, hogy a bayesi megközelítés megóv a p<0,05 olyan típusú félreértelmezésétől, hogy a nullhipotézis valószínűsége kicsi; sőt mi több, ez lesz az univerzális gyógyír, mely a jövőben majd látványosan emeli az orvosi közlemények színvonalát (26, 2932). Az uralkodó (klasszikus vagy frekventista) szemléletmód és a bayesi elveken alapuló statisztikai következtetés közti különbségeket az 1. keretben összegezzük.
|
1. keret. A frekventista és a bayesiánus statisztikai hozzáállás összehasonlítása Képzeljük el, hogy egy placebokontrollos vizsgálat adatait felhasználva elemezni akarjuk, valamely új gyógyszer javítja-e a myocardialis infarktus utáni túlélést. Ezt a kockázataránnyal mérjük a kezelt és a kontrollcsoportban a halál kockázatának hányadosával. Ha ez az arány például 0,5, akkor az új gyógyszer 50%-kal csökkenti a halál kockázatát. Ha a hányados 1, akkor a kezelésnek nincs hatása.
Ha a kockázati arányról nincs határozott à priori meggyőződésünk (elég széles tartományt tartunk egyformán valószínűnek), akkor a frekventista és a bayesiánus elemzés eredményei nem sokban térnek el egymástól; mindkét módszer azon alapul, amit a statisztikusok az adatok valószínűségének neveznek. Ilyenkor:
|
Mennyire szignifikáns, ami szignifikáns?
A XX. század első évtizedeiben, amikor a statisztikai következtetés alapelveit kidolgozták, a tudomány sokkal kisebb méretű vállalkozás volt, mint manapság. Mikor évente csak pár száz hipotézist vizsgáltak és a számításokat sok fáradságos munkával, mechanikus számológépekkel végezték (mint azt Fisher korabeli fényképén is láthatjuk), ésszerűnek tűnt, hogy az 5%-os álpozitív arány kiszűri a legtöbb véletlen hibát. Mikor azonban folyóiratok ezrei évente hipotézisek milliárdjait vizsgálják és a statisztikai programcsomagokkal a számítások könnyűszerrel elvégezhetők, akkor feltehetőleg a valódi jelentéssel bíró eredmények aránya (abban az értelemben, hogy a hatás nagysága révén érdeklődésre tarthatnak számot) jelentősen csökkent. Mindez oda vezet, hogy a p<0,05 eredménynek kicsi a prediktív értéke a nullhipotézis jogos elvetése szempontjából.
A vizsgálatokban a próba ereje legtöbbször kellőképpen növelhető az elemszám vagy a mérések pontosságának növelése által. A 3. táblázat a különböző p-érték-határokhoz tartozó prediktív értékeket mutatja a próba erejének és a jelentőséggel bíró hipotézisek számának különböző értékei esetén. Bármely p-küszöbnél jelentősen csökkenthető az álpozitív szignifikáns eredmények aránya a próba erejének növelése által. A 3. táblázat azt mutatja, hogy ha csak nem vagyunk nagyon pesszimisták a valóban jelentős hipotéziseket illetően a 0,001-nél kisebb p-értékeket már nyugodtan tekinthetjük elégséges bizonyítéknak a nullhipotézis ellen.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A bizonyítékokkal szemben támasztott kritériumok szigorítása ellen legtöbbször azt az érvet szokták felhozni, hogy jelentősen megnő a vizsgálatok mintaelemszáma. Meglepő, de ez nem igaz. Hagyományos erőszámításokkal ki lehet mutatni, hogy a legnagyobb méretnövekedés, melyet a 0,05-ról a 0,01-os határra való áttérés okozhat, 1,75-szoros, míg a 0,001-re való áttérés okozta maximális méretnövekedés 2,82-szoros. Az erő növélésére szolgáló kétféle lehetőség közül inkább a pontosság, mint a mintaelemszám növelését ajánljuk (33). Ha kevesebb, de nagyobb erővel rendelkező vizsgálatokat végeznénk, feltehetőleg megállíthatnánk az orvosi kutatások további hitelvesztését. A nagy méretű, statisztikailag pontos vizsgálatok szükségességét Richard Peto és munkatársai már évek óta hangsúlyozzák (34). Mindezek ellenére az orvosi kutatások minősége nem fog egyből megváltozni attól, hogy egy esetlegesen választott küszöbszámot (p=0,05) egy másikkal (p=0,001) helyettesítünk.
A p-értékek interpretálása: vélemények, döntések és a korábbi bizonyítékok szerepe
A különböző orvosi vizsgálatok célja sokszor nem az egyértelmű állásfoglalás valami mellett vagy ellen, inkább csak hozzájárulás a már meglévő tudásanyag bővítéséhez. Az eredmények közlésénél ezért a pontos p-értéket kell megadnunk, mellőzve mindennemű esetlegességet a küszöbérték kiválasztásában. Javasoljuk, hogy az újabb vizsgálat eredményeinek a korábbi ismeretanyagba való beépülését az ábrán látható módon tegyük közzé. A középső zónába eső p-értékek bizonyítékot jelentenek ugyan a nullhipotézis ellen, de nem döntőt.
Ritkán fordul elő, hogy olyan témában kutatunk, mellyel korábban még senki sem foglalkozott, s így nincsenek előzetes ismereteink. Az előzetes ismeretek jelentőségének felismerése tükröződik a szintetizáló formális kutatási módszerek fejlődésében (35), különösképpen pedig az eredeti közlemények megbeszélésében szereplő metaanalízisek növekvő gyakoriságában (36). Ezekben az esetekben az à priori bizonyíték egyszerűen a korábbi vizsgálatok eredménye. Természetesen megengedett a bizonyítás más formája is: az állatokkal vagy szövetkultúrákkal végzett kísérletek eredményével való összekapcsolás, a betegségek előfordulási arányánál az ökológiai különbségekben észlelt évszázados trendek figyelembevétele ezek mind-mind befolyásolhatják a további lépésekről való döntést az aktuális vizsgálat eredményének függvényében (37).
A közvélemény sok tekintetben a kutatók előtt jár az új bizonyítékok interpretálásában. Az életvitelben rejlő veszélyek-ről szóló közleményeket legtöbbször jogos és józan cinizmussal fogadják (38). Úgy tűnik, hogy az emberek reakciója tudat alatt bayesiánus, melyben az az à priori meggyőződés, hogy a kutató orvosok és főképpen az epidemiológusok legtöbbször halandzsáznak. Az orvosi kutatásban figyelmen kívül hagyják azokat a jelzéseket, hogy itt volna az ideje a teljes váltásnak, a bayesiánus statisztikai következtetési módra való áttérésnek. Ennek fő oka, hogy az à priori meggyőződés nehezen számszerűsíthető. Mekkora súlya legyen például a biológiai bizonyítékok adott konstellációjának, ha ellentétben állnak a nagy nemzetközi vizsgálatok alapján a betegség előfordulási arányai közti különbségről alkotott képpel? Hasonlóképpen, egy jelentőséggel bíró hipotézis esetén, valamint egy előfordulási arány feltételezett értékére alapozva nem nehéz ugyan kiszámolni a p<0,05 prediktív értékét, de ki tudja pontosan megmondani, hogy mennyi a valóságban az az arány? A 2. és 3. táblázat sajnos csak illusztrációként szolgál. Ha úgy akarunk kitérni az à priori bizonyítékok számszerűsítése elől, hogy a véleményünket elég általánosan (és bizonytalanul) fogalmazzuk meg, akkor a bayesiánus elemzés a standard elemzéshez lesz hasonlatos. Másrészt ésszerűnek tűnik, hogy a p=0,008 értéket más súllyal vegyük figyelembe, ha egy klinikai vizsgálat fő hatásmutatójára vonatkozik, mint akkor, amikor egy megfigyeléses vizsgálat számos változójának egyikére kapunk hasonló értéket. A fontos hipotézisek aránya ugyanis magasabb az első esetben, a torzítás és a zavaró tényezők előfordulása pedig kevésbé valószínű.
![]() |
Hogyan tovább?
A szignifikanciapróbák jelenlegi gyakorlatának félrevezető jellegét háromféle módon enyhíthetjük. Először is, amint a 3. táblázat mutatja, a p<0,05 nem tekintendő elfogadható bizonyítéknak a nullhipotézis ellen. Másodszor, az is világos, hogy a valódi jelentéssel bíró hipotézisek arányának növelése is csökkenti a félreértelmezési lehetőségeket. Ez utóbbit, sajnos, nehéz megvalósítani: maga az a fogalom, hogy egy à priori hipotézis megfogalmazása szavatolja a félreértelmezés elkerülését, félreértelmezhető. Ha 100 klinikai vizsgálatot végzünk egy teljesen hatástalan kezelés kipróbálására, s a 100 vizsgálat mindegyikében csak egyetlen hipotézist fogalmazunk meg és egyetlen statisztikai próbát végzünk, akkor is megkérdőjelezhető a szignifikáns eredmények mindegyike. Sőt, nehéz ellenőrizni az olyan típusú kijelentéseket, hogy a kapott összefüggéseket valóban a már korábban létező hipotézisek miatt vizsgálták. Ezt az elvet gúnyolta ki Philip Cole, bejelentvén, hogy egy számítógépes algoritmus segítségével létrehozta az epidemiológia összes lehetséges hipotézisét, így tehát ezentúl minden statisztikai próba à priori hipotézist vizsgál (39). Harmadrészt, a legfontosabb nem a statisztikai paradigmaváltás, hanem a vizsgálatok minőségének javítása az elemszám és a mérési pontosság növelése révén.
Bár nem létezik egyszerű megoldás, mégis elképzelhető a statisztikai próba eredménye általi félrevezettetés kockázatának csökkentése. Ez a szerkesztőkön is múlik. Alapvetően megváltozott például a közlemények minősége a 80-as években, mikor az útmutatók mindegyike elkezdte hangsúlyozni a megbízhatósági tartományok közlésének fontosságát. Hasonló elmozdulásra volna most szükség a hipotézisvizsgálatok terén. Javasoljuk, hogy a szerkesztők kérjék a szerzőktől a 2. keretes szövegben megfogalmazott elvek követését az eredményközlésben.
|
2. keret. Javasolt útmutató az orvosi szaklapokban megjelenő statisztikai elemzések eredményközléséhez
|
Köszönettel tartozunk S. Goodman professzornak, dr. M. Hillsnek és dr. K. Abramsnak a kézirat első változatának olvasásakor adott hasznos tanácsaikért, bár ez természetesen nem jelenti az elveinkkel való egyetértésüket. Bristol a központja az MRC Health Services Research Collaboration-nak.
Érdekütközés: Mindkét szerző bevallja, hogy korábban tévesen alkalmazta a szignifikancia kifejezést és túlbecsülte a hipotéziseiket alátámasztó bizonyítékok erejét.
Támogatás: Nem volt.
Department of Social Medicine, University of Bristol, Bristol BS8 2PR Correspondence to: J. Sterne BMJ 2001;322:226-31.
Jonathan A. C. Sterne, senior lecturer in medical statistics
George Davey Smith, professor of clinical epidemiology
jonathan.sterne@bristol.ac.uk