• Предприемачество
    • Създаване на предприемачи
  • LEAN Six Sigma
    • Шест Сигма
    • Прочети
    • Инструменти
  • Иновация
    • Коста Рика Innova
  • Анализ на данните
    • Минитаб
  • Качество
    • Лидерство
    • CQE
  • Новини
    • Работа в BBCross
    • Книжни истории
  • Проекти
    • Въведение в новия продукт
  • Софтуер и уеб
    • Управление на данни
    • Код
  • Отрасли
    • Храна
    • Медицински устройства
    • Верига за доставка
    • Дигитална трансформация
    • Стандартизация
  • Поддръжка и често задавани въпроси
    • Виртуален кампус на BBCross
    • електронно обучение
    • Обучение
    • GAGEpack
    • Често задавани въпроси за SQCpack
    • Често задавани въпроси за анализатора на промените
    • Често задавани въпроси за Prezi
    • ASQ
  • Събития
    • На линия
    • Вътрешен и публичен

Съхранявайте от BBCross

Уроци, новини, критерии и други

неговите

Facebook Live

Иновация за подобрение от BBCross ™

"Парадоксът на Симпсън" е добре познат феномен, който може да наруши причинно-следствените връзки в наборите от данни в присъствието на събеседник или ковариатор. В тази статия ще говорим за някои практически начини да се предпазите и да не станете жертва на този коварен ефект.

За да освежите паметта си, Парадоксът на Симпсън е името, дадено на явлението, при което посоката на ефекта се обръща, когато се вземе предвид предварително игнорирана променлива („дебнеща“ променлива, наричана още скрита променлива), която влияе значително на връзката.

Изучаването на физическите упражнения

Ще разработим определението с пример. Вие отговаряте за проучване, сравняващо как две (2) техники за отслабване - диета и упражнения - влияят върху загубата на тегло при пациенти с наднормено тегло. Като цяло имате 240 пациенти, участващи в проучването, като 120 са назначени за диета за отслабване, а останалите 120 са назначени за контролиран режим на упражнения.

В края на 30-те дни измервате загубата на тегло на всяка група. Данните показват, че 70 диети и 57 спортисти са отслабнали значително, представлявайки 58% в диетичната група и само 48% в групата за упражнения - значителна разлика. Така че трябва ли да заключите, че диетата е по-добра от упражненията?

Не, затова Simpson Paradox може да бъде толкова сложен! Когато данните са стратифицирани по отношение на индекса на телесна маса (ИТМ) на участниците, както е показано по-долу, се появява по-ясна картина:

(оригинална таблица на статиите)

Когато се гледа от ИТМ група, може ясно да се види, че процентът на пациентите, загубили тегло при всеки ИТМ, е по-малък сред хората, които се хранят с диета, отколкото спортистите. Изненадваща променлива („дебнещо“, скрито) е небалансираното разпределение на пациентите със затлъстяване и тежко затлъстяване в групите за диета и упражнения.

Както можете да видите, числата са обърнати между двете групи: 40 затлъстели и 80 тежко затлъстели в диетичната група и 80 затлъстели и 40 тежко затлъстели в групата за упражнения. Тъй като изглежда, че групата със силно затлъстяване изглежда е спечелила несъразмерно повече от всяко лечение, групата за упражнения е наказана просто поради по-малкото тежко затлъстяване в тази група.

Парадоксът на Симпсън в действие: Процентът на пациентите, загубили тегло, е по-висок сред спортистите, които са били със затлъстяване и тежко затлъстяване, но когато се добавят двете групи, хората, които спазват диета, са тези, които са загубили най-много тегло.

Тук играят два фактора. Първо, има пренебрегвана объркваща променлива (ИТМ) и второ, непропорционално разпределение на нивата на ИТМ между експерименталните групи (диета и упражнения). Не знаем причината за непропорционалното разпределение, но можем да предположим, че пациентите по някакъв начин сами са избрали към коя от двете групи ще принадлежат.

Простите диаграми и графики могат да помогнат много в обяснението на случващото се в основните данни. Вижте например тази колонна диаграма, направена в Microsoft® Excel®, която представлява дезагрегираните данни; показва пропорциите на диети и спортисти във всяка ИТМ група.

Следващата графика показва пропорциите на пациентите със и без загуба на тегло сред различните подгрупи.

Ясно е, че повече спортисти отслабват във всяка ИТМ група (имайте предвид сините нива в първите две двойки колони), но че в общата проба пропорциите изглежда са обърнати.

За да се избегнат неверни резултати, винаги е добра практика да се изследва дали връзката в съвкупността от набора от данни се съхранява в подмножествата, особено когато някои групи не са представени по същия начин, както други в данните.

Друг начин може да бъде претеглянето на пробите според техните размери.

За съжаление инструментите за статистически анализ са точно това - инструменти, които ви помагат да организирате и анализирате наблюдавани данни.

Те не могат да ви кажат нищо за данни, които не са били видяни или не са били включени в анализа.

Поради това е много важно да се включат междуфункционален екип и особено експерти и специалисти по предмета в първоначалното планиране и подбор на променливите, които ще се измерват. След като данните бъдат събрани, единственият начин да се опитате да избегнете този подвод е визуално и по друг начин да изследвате значителни подмножества от данните.

Парадоксът на Симпсън обикновено няма да бъде проблем в добре проектирания експеримент или проучване. Можете да идентифицирате възможни „скрити“ променливи и да ги контролирате адекватно, като ги премахвате, поддържате постоянни за всички групи или ги включвате в изследването.

Правилното рандомизиране също допринася за минимизиране на ефектите от скрита променлива, която може да е била пропусната. В Анализ на ковариацията, при който към модела са добавени възможни променливи (ковариати), свързани с отговора (в нашия пример първоначалният ИТМ не е свързан с леченията, но е повлиял на загубата на тегло) и също ще помогне.

Ако обаче нямате възможност да планирате своето проучване, получавате данни от база данни и ви молят да „намеря каквото мога“, урокът на Парадокс на Симпсън е винаги да разглеждате данните на различни нива на агрегиране, както в предишния пример.