Недостатъците на рандомизираното контролирано проучване
Като всяка друга естественонаучна дисциплина, съвременната медицина се основава на емпирични свидетелства. Това твърдение изглежда тривиално, също както и твърдението, че именно така трябва да бъде. Наистина, трудно е да си представим на какво друго би могла да се основава медицината. Макар несъмнено да има хора, които смятат, че наред с емпиричните свидетелства, добри кандидати за нейната отправна точка са астрологията, нумерологията, „божествено откровение“ или пък различни видове врачки, тяхното мнение няма да бъде прието за сериозно в науката. Поради общоприетата тежест на свидетелствата в медицината, в последните двадесетина години на Запад много бързо се разви една по-крайна форма, известна като „медицина, основана на емпирични свидетелства“ (evidence-based medicine)1. В България може да видите последното преведено като „медицина, основана на доказателства“, но този превод е неточен: с „доказателства“ боравят математиката и логиката; емпиричните свидетелства не „доказват“ каквото и да било, но могат да служат в полза на потвърждението или пък опровержението на дадена (ясно дефинирана) научна хипотеза или теория.
Във въпросната сфера на медицината, основана на емпирични свидетелства, съществува обезпокоителна тенденция – да се градират по важност различните видове емпирични свидетелства. Начело на йерархията най-често биват поставяни резултатите от т.нар. „рандомизирани контролирани проучвания“ или резултатите от мета-анализ, базиран на данните от рандомизирани контролирани проучвания2,3. Малко по-надолу ще хвърлим светлина върху същността на рандомизираното контролирано проучване. На първо място обаче трябва да отбележим, че въпроси като това какво са „емпирични свидетелства“, как емпиричните свидетелства допринасят за потвърждението или опровержението на научни хипотези и теории, в какви степени може да става това и как да мерим въпросните степени, са въпроси централни за философия на науката, и по-конкретно за нейната поддисциплина, известна като „теория на потвърждението“. Споменатите въпроси очертават проблеми, които изобщо не са тривиални и някои от най-големите философи на науката, логици и статистици на 20-ти век са разсъждавали усилено по тях, като дебатът продължава да бъде отворен и разгорещен4. Въпросът е (може да звучи изненадващо за някои), че именно от философия на науката получаваме смислена и информирана критика относно обезпокоителната тенденция в медицинските проучвания, за която става дума тук5,6. Тя се състои в издигането на рандомизираното контролирано проучване „на пиедестал“. С други думи, това е убеждението, че единствено то предоставя най-доброто възможно свидетелство, и когато то е налично, неговата тежест за потвърждението или опровержението на дадена хипотеза следва да надхвърли тежестта на всякакъв друг вид свидетелства. Случва се дори да се стигне до там да се смята, че всякакъв друг вид свидетелства си струва да бъдат разглеждани само тогава, когато няма наличен резултат от рандомизирано контролирано проучване по въпроса7.
Рандомизираното контролирано проучване
Преди да пристъпим към проблемите на тази позиция, нека с няколко думи кажем какво представлява самият метод на рандомизирано контролирано проучване. В медицинските изследвания рандомизираното контролирано проучване (randomized controlled trial) е вид експериментален дизайн, или метод на провеждане на експерименти, който цели да установи ефективността на определени лекарствени средства или медицински практики. За целта изследователите събират голяма група от пациенти, страдащи от определено заболяване, като често се смята, че колкото повече са пациентите, толкова е по-добре за точността на резултата. В най-простия вид проучване пациентите биват разделени на две групи на случаен принцип, затова и проучването се нарича „рандомизирано“ (от английски random – случаен, произволен). На едната група се прилага експерименталното лечение под строг, предварително установен контрол, а на другата група се дава най-често плацебо (т.е. фиктивно лечение) или в някои случаи се прилага установеното до момента лечение. Експериментът продължава определено време, след което се прави статистически анализ, сравняващ резултатите от двете групи. Ако се открие статистически значим резултат в полза на експерименталното лечение, то това се смята за емпирично свидетелство в полза на хипотезата, че въпросното лечение е ефективно, или поне по-ефективно от „лечението“ с плацебо или от вече установената медицинска практика за лечение на заболяването. Ако не се открие статистически значим резултат, то тогава се смята, че не може да бъде отхвърлена т.нар. „нулева хипотеза“, която твърди, че експерименталното лечение е неефективно.
Основният и най-често изтъкван аргумент в полза на рандомизираното контролирано проучване е, че чрез процеса на рандомизация, т.е. чрез случайния принцип, според който пациентите се разпределят в една от двете групи, изследователите успяват да проконтролират, или да се защитят, от въздействието на всевъзможни външни за изследването променливи, които могат да повлияят на резултата. С други думи, рандомизацията контролира всякакви потенциално опасни за обективността на резултата външни променливи, като например: възможни субективни предпочитания от страна на някой от изследователите, възможността в една от двете групи нарочно да попаднат повече пациенти на базата на възрастов или полов фактор, на базата на напредналостта на заболяването си или пък на медицинското им досие, и т.н. Още повече, смята се, че рандомизацията защитава не само от множеството познати външни променливи, можещи да провалят едно проучване, но и от всевъзможните непознати такива. Напълно възможно е погрешното приписване на даден ефект към някакъв фактор там, където ефектът всъщност е плод на друга, „скрита“ променлива, за която изследователите в първоначалното проучване не знаят. След малко ще видим един такъв забавен пример. Но става дума за това, че поддръжниците на абсолютното налагане на рандомизираното контролирано проучване изграждат основния си аргумент, обявявайки, че то успешно се справя с подобна опасност.
Случайност на разпределението
Първият проблем на въпросния аргумент е, че неговото централно твърдение не е съвсем вярно. Всъщност нищо не гарантира равното разпределение на всички значими за проучването променливи „на случаен принцип“. Твърдението се основава на погрешното схващане, че например хвърлянето на добре балансирана монета 10 пъти и получаването на резултат 9 пъти ези и 1 път тура е „случайност“, докато хвърлянето ù 10 пъти и получаването на 5 пъти ези и 5 пъти тура не е случайно6. Това, което основните правила на математическата теория на вероятностите ни казват, е, че когато идеално балансирана монета бъде хвърляна брой пъти, клонящ към безкрайност, то тогава пътите, в които се пада ези, и тези, в които се пада тура, ще клонят към равен брой. Но от това по никакъв начин не следва, че в конкретен случай на 10, 50 или 500 хвърляния, те ще бъдат равен брой. Всъщност аксиомите и теоремите на теория на вероятностите са напълно в съответствие с това да хвърлите въпросната идеално балансирана монета 50 пъти и да получите 5 ези и 45 тура. Макар и малко вероятен, този резултат е съвсем възможен и не е с нищо повече или по-малко „случаен“ от всеки друг. Не е по-различно и при случайното разпределение на пациенти между двете групи в едно рандомизирано контролирано проучване. Съвсем възможно е да получите изключително небалансирано разпределение на някаква ключова за изследването променлива. Ако изследователите правеха нови и нови рандомизации, т.е. разпределяха пациентите на случаен принцип отново и отново, в общ брой пъти, клонящ към безкрайност, то тази възможност щеше да има вероятност, клоняща към нула. Но ние не живеем в свят на математически безкрайности и лимити, а в ограничения свят на физическата реалност, в който изследователите най-често са ограничени в практиката си до една единствена рандомизация. Дори когато те следят тази рандомизация за дисбаланс на някои основни познати променливи, с цел евентуално да повторят рандомизиращия процес, ако тя се окаже особено небалансирана, остават още на теория безкрайно много непознати такива променливи, срещу които случайното разпределение съвсем не ги защитава8. Още повече, че проконтролирането на субективния фактор може да бъде осъществено по други начини, освен случайното разпределение на пациентите. Например то в повечето случаи е вече гарантирано в т.нар. „двойно слепи проучвания“ (double-blind trials), в които нито пациентите, нито лекарите, които прилагат лечението им, имат представа за това кой пациент на коя група принадлежи. Въпросът е, че дори да има полза от рандомизацията, а тя несъмнено има и своите положителни черти, на нея е абсурдно да се набляга като на единствен най-важен елемент в едно добро проучване.
Отстраняване на субективния фактор
За да не изглежда, че разсъждаваме само на теория, ето един забавен пример от Британския журнал по медицина от 2001 година9. Професор Леонард Лейбовици от университета в Тел Авив подбрал 3393 пациенти с установена в болнични условия инфекция на кръвта, за периода 1990-1996 година. През 2000-та година, т.е. 4 години след установяването на инфекцията, той разпределил пациентите на случаен принцип в две групи (използвайки генератор на случайни числа). Коя от тези групи ще стане контролна, с други думи, коя от тях няма да получи „лечение“, било определено с хвърляне на монета, като 1702-ма души били разпределени в нея, а 1691 – в основната група. Изследването спазвало всички правила на рандомизираното контролирано проучване и дори било следено за дисбаланс в някои от основните външни променливи между групите, като риск от смърт и напредналост на заболяването. Такъв дисбаланс не бил открит и имената на пациентите от основната група били дадени на човек, който казал кратка молитва за благоденствието и пълното възстановяване на групата като цяло. Резултатите, които били сравнени между групите, са смъртност, време на болничния престой и продължителност на високата температура (>37.5°C). Смъртността била 28.1% (475/1691) в основната група, срещу 30.2% (514/1702) в контролната; резултат, който не бил приет за статистически значим. От друга страна, както времето на болничния престой, така и продължителността на високата температура били значително по-кратки в основната група (със статистическа значимост съответно p = 0.01 и p = 0.04). На базата на тези резултати, Лейбовици саркастично заключава, напълно в съответствие с приетата в медицината методология, че отдалечената молитва от трето лице успява „със задна дата“ да съкрати времето на болничния престой и продължителността на високата температура при пациенти с инфекция на кръвта и следва да бъде разгледана като възможност за лечение в клиничната практика. Както казва философът на науката Джон Уоръл, дори тези от вас, които смятат, че „неведоми са пътищата Божи“, едва ли ще сметнат, че те са чак толкова „неведоми“6.
Основната причина да не се поддаваме лесно на заключения като горното е, че притежаваме някаква предварителна информация относно това как стоят нещата от света и когато нашата предварителна вероятност за подобен резултат е изключително ниска, то ние не само не сме склонни да му повярваме, но дори го гледаме с насмешка. Именно този „субективен“ фактор на предварителна информация, наред с останалите „външни“ за изследването променливи, се стреми да елиминира рандомизираното контролирано проучване. С други думи, рандомизацията би трябвало да защитава от внасянето на каквато и да било предварителна информация в проучването от страна на изследователите. На базата на горния пример ясно можем да видим защо това е „нож с две остриета“ – в случая цената на повишената научна обективност е достигането до абсурдни заключения. Още повече, че рандомизираното контролирано проучване далеч не успява да се изолира от субективни фактори, макар такъв да е патосът на организацията му. Предварителният подбор на пациентите, продължителността на проучването, както и прагът на статистическа значимост, си остават определени от външна и предварителна за изследването информация.
Етични съображения
На последно място, но далеч не и по значение, рандомизираните контролирани проучвания изискват време за своето провеждане и не могат да дадат каквито и да било валидни резултати преди приключването си. Те изискват поставянето на част от пациентите в контролна група, в която или не им се провежда лечение (т.е. „лечението“ е просто фиктивно), или лечението, което им се провежда, е с доста съмнителна ефективност спрямо новото лечение. В някакъв процент от общите случаи, положителният ефект от новото лечение е установен на базата на друг вид емпирични свидетелства и е жизненоважен за спасяването на живота или за запазването на качеството на живот на пациентите. Именно в такива случаи, времето на провеждане на едно рандомизирано контролирано проучване, в което част от пациентите ще бъдат обречени на контролната група, може да се окаже фатално за тях или пък значително да понижи качеството на оставащия им живот. Разбира се, възможността за приложението на ново и експериментално лечение, което не е преминало всички проучвания (в частност: рандомизирано контролирано проучване), трябва внимателно да бъде балансирана срещу възможността пациентите да пострадат невъзвратимо, ако то не бъде приложено. Става въпрос за вид морална дилема в медицинската етика, в която често няма „правилен отговор“, но пък може да има оптимално решение. Ако обаче рандомизираното контролирано проучване се приеме за единствения правилен метод за добиване на емпирични свидетелства, а се обезцени важността на емпиричните свидетелства, придобити чрез различна научна методика, то в много случаи практикуващите лекари ще бъдат принудени да приложат под-оптималното решение, с всичката вреда за пациентите, която произтича от него.
Предимствата на бейсианската статистика
Поради изброените недостатъци на класическата методология на рандомизирани контролирани проучвания, в статистиката в последни години се наблюдава обрат и все повече статистици се обръщат към т.нар. „бейсианска статистика“, която не се опитва да изолира и отстрани субективния фактор в проучванията, а го инкорпорира в своите изчислителни методи. По този начин последната се справя в случаи, в които рандомизираните контролирани проучвания се провалят. Още повече, в литературата съществува доста сериозна аргументация на тезата, че бейсианската статистика се справя по-добре във всички случаи, а класическата методология почива на проблемни или направо погрешни предпоставки. Казано съвсем накратко, бейсианската статистика борави с теория на вероятностите, като в основата й е небезизвестната теорема на Бейс (Bayes‘ theorem). За бейсианците вероятностите изразяват субективните степени на убеденост на някого, относно някакво твърдение (или хипотеза, теория, и т.н.). Макар много учени да биха подходили с резервираност, когато чуят думата „субективен“, тук няма нужда да става дума за причудливите мнения на някого, за нещо мистериозно или пък неизмеримо. На първо място, въпросният субективен фактор в бейсианската статистика има все по-малко значение, колкото повече емпирични свидетелства се натрупват5. Разяснението на механизма, по който това става, е за съжаление твърде дълго и техническо, за да го разгледаме тук. На второ място, субективният фактор може да бъде от полза. Всъщност става дума за предварителната информация, с която всеки неминуемо подхожда към което и да било изследване. Тя ни дава възможността да определим параметрите на изследването предварително, както и да разгледаме резултатите от него с критично око. Същата тази предварителна информация ни дава възможността да споделим сарказма на Лейбовици, вместо да приемем получените от него резултати, без да подозираме, че правим абсурдно заключение.
Литература
- Gray M. Evidence-Based Healthcare and Public Health: How to Make Decisions about Health Services and Public Health. Edinburgh: Churchill Livingstone, 2009.
- Agency for Healthcare Research and Quality Systems to Rate the Strength of Scientific Evidence. Summary Evidence Report/Technology Assessment, 2002; 47:1-11
- Schünemann H., Fretheim A., Oxman A. Improving the use of research evidence in guideline development: 9. Grading evidence and recommendations. Health Research Policy and Systems, 2006; 4:21.
- Churz G. Philosophy of Science: A Unified Approach. London: Routledge, 2014.
- Howson C., Urbach P. Scientific Reasoning: The Bayesian Approach, Third Edition. Chicago, Illinois: Open Court, 2006.
- Worrall J. Evidence: Philosophy of science meets medicine. Journal of Evaluation in Clinical Practice, 2010; 16:356-362.
- Sackett D., Rosenberg W., J. Gray et al. Evidence Based Medicine: What It Is And What It Isn’t: It’s About Integrating Individual Clinical Expertise And The Best External Evidence. British Medical Journal, 1996; 312:71-72.
- Lindley D. The Role of Randomization in Inference. Philosophy of Science Association: Proceedings of the Biennial Meeting of the Philosophy of Science Association, 1982, 2:431-446.
- Leibovici L. Effects of Remote, Retroactive Intercessory Prayer on Outcomes in Patients with Bloodstream Infection: Randomized Controlled Trial. British Medical Journal, 2001; 323:1450-1451.
Изключителна статия! Браво!