М. изследвания

Индекс на съдържанието

Въведение

Когато анализирате данните, събрани за разследване, изборът на подходящ метод за анализ е от решаващо значение, за да се избегнат неправилни заключения. Изборът на най-подходящата техника за анализ трябва да бъде направен, като се вземат предвид различни аспекти, свързани с дизайна на изследването и естеството на данните, които трябва да се определят количествено. Броят на групите наблюдения, които трябва да се сравняват, естеството на същите (в зависимост от това дали са независими извадки или повторни наблюдения върху едни и същи индивиди), видът данни (непрекъснати/качествени променливи) или тяхното вероятностно разпределение са определящи елементи за времето да научите за статистическите техники, които могат да бъдат използвани.

непараметрични

При анализа на количествените данни статистическите методи, най-известни и използвани в практиката, като t тест на Student или дисперсионен анализ, се основават на предположения, които не винаги се проверяват от наличните данни. По този начин е обичайно да се приема, че променливата от интерес следва, например, разпределение на Гаус. Когато липсата на нормалност е очевидна или не може да се приеме напълно от намален размер на извадката, обикновено се използва трансформация на интересуващата променлива (например логаритмичната трансформация), за да се симетризира нейното разпределение или да се оправдае използването на техниките, които обикновено се прибягват до тяхната здравина (т.е. ниската им чувствителност към отсъствието на нормалност). Има и други методи, обикновено наричани непараметрични, които не изискват този тип хипотеза за разпределението на данните, те са лесни за изпълнение и могат да бъдат изчислени дори при малки размери на извадката. В настоящата работа ще бъдат описани някои от най-използваните на практика непараметрични методи.

Две независими проби: тестът на Ман-Уитни и тестът за ранг на Уилкоксън

В много ситуации е желателно да се провери дали разпределението на променлива X е равно в две популации или споменатата променлива има тенденция да бъде по-голяма (или по-малка) в една от двете групи, на базата на примерните данни. Например, може да е интересно да се сравни загубата на тегло при пациенти, подложени на две различни диети, или нивото на болка при пациенти с остеоартрит, които получават лечение спрямо плацебо. В „традиционната“ статистическа теория тестът, който би се прилагал за извършване на този тип сравнение, би бил тестът на Student за две независими извадки, като U-тест на Mann-Whitney или тест за сумата на ранга на Wilcoxon без характер. еквиваленти, които също биха могли да се използват в тази ситуация.

Да предположим по-формален начин, че има наблюдения на една и съща променлива X (загуба на тегло, оценка на болката и т.н.) в две различни популации на проби с размер n1 и n2, съответно:

Население 1:
Население 2:

Интуитивен начин да се продължи е да се подредят получените наблюдения, независимо от тяхната популация, от най-ниска до най-висока стойност и да се присвоят диапазони на така наредените данни. По този начин на наблюдението с по-малка стойност се присвоява ранг 1, следващият ранг 2 и т.н. В случай на равенства (ако две или повече наблюдения съвпадат по стойност), на всяко от тези наблюдения ще бъде присвоена средната стойност на диапазоните, които биха били присвоени, ако нямаше равенство.

Ако няма разлики в разпределението между двете популации, диапазоните трябва да бъдат произволно смесени между двете проби. От друга страна, ако сумата от диапазоните, определени за наблюденията на една от популациите, е много по-голяма от сумата от диапазоните, определени за наблюденията на другата популация, това би означавало разлика в разпределението на променливата X между двете.

Нека означим с ранга, присвоен на всяко от наличните наблюдения. Ще разгледаме сумата от ранговете в една от популациите като статистика за контраста за теста за сумата на ранга на Уилкоксън:

Разпределението на вероятностите на предишните статистически данни е изчислено за малки размери на извадката и при липса на връзки (Таблица 1). По този начин, Таблица 1 е полезно да се знае дали резултатът е значителен на двустранно ниво, ако се работи с 95% сигурност и размерите на пробите ≤15.

За по-големи размери на пробата (> 15) е подходящо да се използва нормалното приближение, като от T се получи променливата:

където и са средното и стандартното отклонение на T, ако нулевата хипотеза е вярна, и са дадени от следните формули:

Y.

Броят на връзките също трябва да е малък спрямо общия брой наблюдения. В случай на връзки, дисперсията на статистиката Т трябва да бъде променена, така че предишният израз да бъде както следва:

След като стойността на z е получена, тя трябва да бъде препратена към таблиците на нормалното разпределение, за да се получи свързаната стойност на значимост.

За да илюстрираме използването на този тест, ще разгледаме данните в таблица 2, съответстващи на стойностите за измерване на болката (по скала от 0 до 10) при две групи от 11 пациенти, подложени на две различни аналгетични лечения. В този случай n1 = n2 = 11. Сумата от диапазоните, определени за наблюденията на първата група, е T = 171 и нейната средна стойност

Тъй като сумата на получените рангове надвишава очакваната, ние ще разгледаме T = 171-126,5 = 44,5 като окончателна статистика и ще я отнесем към стойностите в таблица 1. Работейки с двустранен подход и 95% сигурност, регионът на отхвърляне съответства на Т стойности, по-малки или равни на 96, за които нулевата хипотеза за еднакво ниво на болка и в двете лечебни групи ще бъде отхвърлена с ниво на значимост p тест на сумата от ранга на Wilcoxon с U теста на Mann-Whitney име. Всъщност това са два различни теста, въпреки че по същество са еквивалентни един на друг. За изчисляване на теста Ман-Уитни U, вместо сумата от ранговете, стойностите ще бъдат изчислени:

U12: броят на двойките, за които наблюдението от първата популация е по-малко от наблюдението от втората популация, .

U21: броят на двойките, за които наблюдението от първата популация е по-голямо от наблюдението от втората популация, .

В случай на равенство, 0,5 по-високи единици ще бъдат отчетени във всяка от горните суми. По подобен начин на това, което се е случило с предишния тест, ниските стойности на U12 ще показват разлика към по-високите стойности на променливата в първата популация, докато високите стойности ще показват, че те са склонни да бъдат по-високи в второ население.

Горните параметри са свързани със статистиката на Т, описана по-горе чрез следното уравнение:

По този начин от U статистиката може веднага да се получи стойността на статистиката на Wilcoxon и да се използва предишната методология за получаване на свързаната стойност на значимост. Всъщност повечето статистически програми, като SPSS, показват в своите резултати стойностите на двете статистически данни, заедно с обща р-стойност, изчислена от асимптотичното приближение чрез нормално разпределение или от съответните таблици, коригирайки възможност за връзки. Друг еквивалентен тест, макар и по-малко известен, е S на Кендъл, изчислен според S = U12- U21.

И накрая, да се каже, че точно както дисперсионният анализ на „традиционния“ статистически подход разширява t-теста на Student на случая, в който трябва да се сравняват повече от две групи, тестът на Kruskall-Wallis е естествено продължение на Mann- Тест на Уитни към тази ситуация. За неговото изчисляване ще бъдат подредени получените N наблюдения, независимо от тяхната популация, от най-ниска до най-висока стойност и ще бъдат зададени съответните диапазони. Статистиката на контраста за теста на Kruskall-Wallis ще бъде дадена от:

където N означава общия брой наблюдения в k групите, които се сравняват, това е средната стойност на диапазоните на наблюденията на i-тата група и средната стойност на всички диапазони. Така дефинирана статистика H следва разпределение с k-1 степени на свобода.

Две свързани проби: тестът за знаци и тестът за подписване на ранг на Wilcoxon

Друга много честа ситуация е тази, при която е желателно да се сравни разпределението на променлива X в две проби от сдвоени случаи, обикновено при едни и същи индивиди в два различни момента във времето. Например, може да искате да сравните нивото на болка в ставата преди и след лечение с инфилтрации или теглото преди и след преминаване на програма за отслабване. В тези ситуации е логично да се работи с разликата в наблюденията между двата момента (загуба на тегло, намаляване на нивото на болка и т.н.):

където тук те означават наблюдаваните стойности на променливата X при n индивиди в първия момент и наблюдаваните стойности в по-късен момент.

Един лесен начин да продължите е да преброите броя на положителните разлики и броя на отрицателните разлики (без да броите 0-те стойности). При нулевата хипотеза, че няма разлики, ще бъде еднакво вероятно да се получи положителна или отрицателна разлика, така че и двете стойности ще бъдат разпределени според биномно разпределение на параметри Bi (r + s, 1/2). Използвайки таблиците на биномното разпределение, можем да получим от r (или, еквивалентно от s) точно свързаната стойност на значимост (Таблица 3).

Като пример ще използваме данните в таблица 4, която показва загубата на тегло, постигната от 20 субекта, подложени на програма за отслабване. Броят на положителните наблюдения (пациенти, които действително са отслабнали) е r = 14, докато броят на отрицателните наблюдения (пациенти, които са наддали) е s = 6. Препращайки тези стойности към тези на биномно разпределение на параметрите Bi (20,1/2), се получава стойност p = 2x0,058 = 0,116, така че не може да се заключи, че има значителна загуба на тегло при изследваните пациенти.

За големи размери на пробите (n≥20) като тестова статистика може да се използва следното:

което приблизително ще следва стандартно нормално разпределение N (0,1).

В горния пример:

Ако отнесем получената стойност към вероятностната функция на разпределение N (0,1), получаваме p = 0,075, което не води до значителна стойност, както се е случило с апроксимацията от бинома.

Тестът за знаци, както се нарича току-що описаният тест, представя като основно ограничение факта, че не отчита величината (положителна или отрицателна) на наблюденията. По този начин може да се случи, че има много положителни разлики, но с малък мащаб (пациенти, които губят тегло, но в малък обем) и малко отрицателни разлики, но с много по-голямо значение (пациенти, които наддават много на тегло). Този тип ситуация трябва да намали възможността за откриване на значителни разлики между наблюденията.

Подписаният тест на Wilcoxon за ранг на сумата отчита горния недостатък. Наблюденията се подреждат от най-ниската до най-високата абсолютна стойност и им се присвояват диапазони (игнорирайки нулеви стойности и действайки по същия начин, както в случая на теста за ранг на суми в случай на връзки). Сумата T + на диапазоните, присвоени на положителни стойности, или T-сумата на диапазоните, присвоени на отрицателни стойности, ще се използва като статистика за контраста. За малки стойности на n, разпределението на T + и T- е изцяло таблично и може да се използва за получаване на критичните стойности на теста (Таблица 5). В случай на големи проби (n≥20), разпределението на T + и T- може да бъде апроксимирано с това на нормална променлива. По този начин, извършвайки трансформацията:

свързаното разпределение е това на стандартна норма (където n 'е броят на ненулевите наблюдения).

Както при теста на сумата от рангове за независими проби, в случай на равенство вариацията на статистиката варира и трябва да се направи известна корекция в предишния израз. По същия начин критичните стойности в таблица 5 за случая на връзки са донякъде консервативни, т.е. при връзките, нулевата хипотеза за липса на различия ще има тенденция да се приема, когато в действителност тя трябва да бъде отхвърлена.

Приложен

N1 се определя като най-малкия размер на извадката. T се изчислява като сумата от диапазоните, определени за наблюденията в проба 1. Да, приемаме .
Резултатът е значителен на 5% двустранно ниво, ако T е по-малко или равно на табличната стойност.


к