М. изследвания

Индекс на съдържанието

Въведение

В предишна работа концепциите за систематичен преглед и метаанализ са представени в процеса на синтез на резултатите, постигнати от различни изследвания във връзка с дадена тема. Тази публикация се фокусира основно върху излагането на ограниченията и етапите на систематичен преглед, с кратко описание на статистическите техники, често използвани по време на етапа на метаанализ. В настоящата работа ще бъде направен опит за по-нататъшно описание на наличните статистически методи за комбиниране на резултати в този тип проучване.

инветигаци

Анализът на хетерогенността.

Преди да изберете някой от различните статистически методи, които позволяват комбиниране на отделните резултати от всяко проучване, за да се получи комбиниран оценител на ефекта, ще е необходимо да се определи:

Оценката на степента на хетерогенност може да се извърши с помощта на статистически тестове, като най-широко използван е Q тестът на Der Simonian и Laird. Този тест се основава на изчисляване на претеглена сума от разликите между ефекта, определен във всяко от изследванията (съотношение на шансовете, относителен риск, разлика в средните стойности и т.н.) и глобалната средна стойност:

с .

По този начин, ако изследванията са хомогенни, статистиката следва приблизително разпределение със степени на свобода. Получената стойност за споменатата статистика във всеки конкретен случай се сравнява със съответното теоретично разпределение, като по този начин се получава стойност на значимост, която позволява отхвърляне (р 0,05) на хипотезата за хомогенност. Това обаче е тест с ниска статистическа мощност, така че незначителен резултат обикновено е недостатъчен, за да се заключи, че няма хетерогенност между изследванията и тази възможност трябва да се проучи с други методи, главно графични, като диаграмата на Galbraith или Графика на L'Abbé.

От една страна, графиката на Galbraith представлява точността на всяко изследване (обратната на стандартната грешка на оценката на ефекта) спрямо стандартизирания ефект (т.е. оценката на ефекта, разделена на стандартната му грешка). Представени са и регресионната линия, приспособена към тези точки, и лента на доверие, така че всички точки трябва да бъдат разположени в тази лента. Точките извън тези граници на доверие са тези, които допринасят за най-голяма променливост на анализа. В допълнение, тези изследвания с по-голяма тежест в мета-анализа ще бъдат тези с най-висока точност и следователно могат да бъдат идентифицирани вдясно от графиката.

Графиката L’Abbé е друг полезен инструмент в случай на работа с двоичен отговор (например отговор на ново лечение спрямо друг стандарт). Той представлява съотношението на събитията в контролната група спрямо дела на събитията в групата на лечение. По този начин всяка от точките в графиката представлява относителния риск, съответстващ на различните изследвания, така че диагоналът, който разделя графиката на два раздела, ще остави изследвания, благоприятни за лечебната група от едната страна и тези, благоприятни за лечебната група, от друга контролна група. Наличието на разпръснати точки, които не са разположени успоредно на споменатия диагонал, ще показва възможна хетерогенност.

За да илюстрираме горното, ще разгледаме хипотетичен пример, в който искаме да извършим мета-анализ на 10 клинични проучвания, които се опитват да оценят ефикасността на ново лекарство за лечение на определено заболяване. Във всички проучвания пациентите са рандомизирани да получават или експерименталното лекарство (група за лечение), или обичайното лечение (група за контрол), като се отчита броят на пациентите, които са се възстановили от заболяването във всяка група. Следователно променливата за реакция е излекувана и мярката на ефекта е относителният риск (). Данните, използвани за този пример, са показани в таблица 1.

Тестът на Der Simonian и Laird не разкрива, при ниво на доверие 95%, статистически доказателства за хетерогенност (Q = 14.401; p = 0.109). Графиките на Galbraith и L'Abbé обаче предполагат известна степен на хетерогенност, като едно от изследванията е извън лентите на доверие в първото (това, което осигурява по-ниска оценка на ефекта) и с точки, които не се подравняват около права линия на графиката на L'Abbé (фигури 1 и 2).

Статистически методи за комбиниране на резултати

Въпреки разликите между различните методи, налични за мета-анализ, всички те следват подобна схема. В повечето случаи оценителят на комбинирания ефект се изчислява като средно претеглена оценка на оценките на всяко изследване, където тежестите се присвояват въз основа на прецизността на всяка работа. По този начин, проучванията с по-голяма вариабилност в отговора или с по-малък размер на извадката ще имат по-малък принос към глобалната оценка.

По принцип статистическите методи, които най-често се използват в практиката, могат да бъдат класифицирани в две групи, в зависимост от това дали при анализа е взета предвид хетерогенността между изследванията или не: модели на случайни ефекти и модели с фиксиран ефект.

а) Модели с фиксиран ефект.

В модела с фиксирани ефекти се приема, че няма хетерогенност между изследванията, включени в прегледа, така че всички те да оценяват един и същ ефект и наблюдаваните разлики се дължат единствено на случайността.

Означавайки още веднъж чрез мярката на ефекта (съотношение на шансовете, средна разлика и т.н.), получена от данните от i-то проучване, в модела с фиксирани ефекти се приема, че има фиксиран глобален ефект:

като грешката, допусната при приближаване .

Глобалният ефект може да се оцени като среднопретеглена стойност на индивидуалните ефекти на всяко проучване:

където теглата са дадени като обратна на дисперсията на съответната оценка:

Глобалната мярка на така получения ефект ще има дисперсия, която се дава от:

така че ако се приеме, че следва нормално разпределение, съответният доверителен интервал може да бъде изчислен като .

б) Модели на случайни ефекти.

Напротив, при модел на случайни ефекти се приема, че проучванията, включени в прегледа, представляват произволна извадка от всички съществуващи изследвания. Сега ефектът от всяко проучване се счита за три компонента:

където е общият ефект, който трябва да се оцени, това е ефектът, който трябва да се оцени в i-то проучване (в зависимост от конкретните му характеристики) и грешката, направена при оценката.

Както при модела с фиксирани ефекти, тук общият ефект се изчислява като средно претеглена стойност на отделните оценители, където теглата сега се изчисляват като обратна на сумата от индивидуалната дисперсия на изследването плюс дисперсията между изследванията:

Глобалната мярка на така получения ефект ще има дисперсия, която се дава от:

да може да изчисли съответния доверителен интервал като .

Обикновено се срещат произведения, в които резултатите от мета-анализа се представят съвместно както с модела с фиксирани ефекти, така и с модела на случайни ефекти. Докато някои автори се застъпват за използването на модела на случайни ефекти във всички случаи, други подчертават възможните му недостатъци, като например факта, че той е по-малко точен и осигурява по-широки интервали на доверие от модела с фиксирани ефекти. Като цяло трябва да се има предвид, че основната цел на мета-анализа не винаги ще бъде да се получи комбинирана оценка на ефекта. Когато резултатите от прегледаните проучвания са ясно разнородни, анализът и идентифицирането на причините за такава хетерогенност трябва да се превърнат в основната ни цел. Ако несъответствията не са много големи, моделът на случайните ефекти се превръща в алтернатива на по-простия модел с фиксирани ефекти за комбиниране на резултатите. В случай на по-голяма вариабилност в резултатите, най-добрият вариант ще бъде да не се извършва мета-анализ, да се открият причините за хетерогенността и да се направи анализ на подгрупа.

Представяне на резултатите.

След като бъдат направени горните изчисления, резултатите от мета-анализ обикновено се представят в графика („горски парцел“), в която се показва прогнозният ефект във всяко изследване заедно със стойността, получена чрез комбиниране на резултатите от всички изследвания, придружени от съответните им доверителни интервали. Освен това вертикалната линия на стойността, съответстваща на отсъствието на ефекти (RR = 1 или Разлика на средните стойности = 0), обикновено е представена на графиката. Също така би могло да бъде полезно да се определят границите на клиничното значение, за да се определи дали разликите, освен че достигат статистическа значимост, са със съответна величина.

Обръщайки се още веднъж към предишния пример, Таблица 2 и Фигура 3 показват резултатите от мета-анализа, използвайки както модела с фиксирани ефекти, така и модела на случайни ефекти. Всички проучвания с изключение на едно показват еднородни резултати с благоприятен ефект от експерименталното лечение и RR между 1,04 и 1,57. В случаите, в които доверителните интервали преминават границата без ефект (RR = 1), разликата в степента на отговор не е била статистически значима. С който и да е от двата метода за анализ, резултатите ни позволяват да заключим, че новото лечение е значително по-добро от стандартното лечение за постигане на излекуване на пациентите, като се получават много сходни глобални мерки на ефекта, от RR = 1,21 с модела на фиксирани ефекти и RR = 1,29 с модела на случайни ефекти.

Анализ на чувствителността и пристрастието на избора.

След провеждане на мета-анализ е препоръчително да се проучи влиянието на всяко от изследванията върху получените резултати. Анализът на чувствителността се състои от възпроизвеждане на резултатите от мета-анализа, като на всяка стъпка се изключва едно от изследванията, включени в прегледа. Ако така получените резултати са сходни както по посока, така и по големина на ефекта и статистическа значимост, това показва, че анализът е силен. Същият процес може да се повтори, като се елиминират няколко проучвания едновременно (например тези с по-лошо методологично качество, тези, които не са публикувани и т.н.), за да се определи тяхното възможно влияние върху резултатите.

Заедно с анализа на чувствителността, след като бъдат получени резултатите от метаанализа, трябва да се анализира наличието на евентуална пристрастност, която може да постави под въпрос получените резултати. Сред най-широко използваните методи за оценка на съществуването на този тип пристрастия, най-популярен е графикът на фунията, който се основава на представянето на размера на извадката на всяко произведение спрямо размера на открития ефект. Обикновено всички изследвания откриват ефект с подобна величина, около хоризонтална линия, с по-голяма дисперсия, колкото по-малък е размерът на пробата. По този начин точките биха били склонни да бъдат разпределени под формата на обърната фуния. Ако, напротив, е имало пристрастие към публикуването, на изследванията с по-малък размер на извадката, ще бъдат публикувани само тези, които са открили значителни разлики между групите, така че облакът от точки да изглежда деформиран в една от своите крайности. Съществуват и други статистически техники като тест Бег или Егер, внедрени в повечето програми за провеждане на метаанализи, които позволяват съществуването на евентуална пристрастност на публикацията да бъде оценена по-обективно.

За данните от предишния пример резултатите от анализа на чувствителността и графиката на фунията са показани съответно на фигури 4 и 5. Както може да се види, нито едно от изследванията не променя съществено резултатите, ако е елиминирано от мета-анализа. По същия начин Фигура 5 не показва съществуването на пристрастие към публикацията, което се подкрепя от резултатите от тестовете Begg (p = 0.720) и Egger (p = 0.316).

Накратко, техниките за метаанализ представляват инструмент без прекомерна статистическа сложност, който позволява да се синтезират резултатите от различни изследвания във връзка с дадена тема. Прилагането му е улеснено през последните години благодарение на разпространението на компютърни програми, които прилагат този тип методология, какъвто е случаят със софтуера EPIDAT. Неговата достъпност обаче не трябва да засилва безразборното му използване, пренебрегвайки факта, че понякога проектите на изследванията, които са включени в преглед, тяхното методологично качество или резултатите, които те постигат, представляват висока степен на хетерогенност, която не препоръчва провеждането на мета-анализ.