Заблудата към регресията към средното или защо мерките за сигурност може да не работят добре

iwbg.waykun.com - Как да отслабнете и да останете стройни

„Много интелигентните жени са склонни да се женят за по-интелигентни мъже от себе си“.

На какво според вас се дължи? Възползвайки се от празниците, предлагам да поканите своите шуреи по време на следващото семейно хранене, за да намерите обяснение за този факт.

Някои ще си представят, че тези бедни жени се опитват да избегнат съревнование с еднакво интелигентни мъже или че са принудени да намалят летвата при избора на половинка, защото интелигентните мъже не искат да се състезават с интелигентни жени. Със сигурност братята ви ще предложат много други странни обяснения.

И се обзалагам, че всеки ще тълкува предложението с причинно-следствена гледна точка: силно интелигентните жени умишлено избират (или защото нямат избор) по-малко интелигентни мъже. Тоест съществува причинно-следствена връзка.

Нека сега разгледаме следното твърдение:

„Съотношението между IQ на съпрузите е по-малко от перфектно“.

Колко братя в момента ще скочат, за да дадат мнението си? Както обяснява Канеман в книгата си „Мисли бързо, мисли бавно“:

„Това твърдение очевидно е вярно и не представлява интерес. Кой би очаквал корелацията да бъде перфектна? Тук няма какво да се обяснява. Но твърдението, което намираме за интересно, и твърдението, което намираме за тривиално, са алгебрично еквивалентни. Ако съотношението между интелигентността на съпрузите е по-малко от перфектно (и ако, като се вземат предвид средните стойности, мъжете и жените не се различават по интелигентност), тогава е математически неизбежно много интелигентните жени да се женят за мъже, които ще бъдат средно по-малко интелигентни от тях (и обратното, разбира се). "

Свидетели сме на статистически феномен, известен като регресия към средното.

От много високи родители, по-малко високи деца

Многознанието Франсис Галтън беше първият, който наблюдава явлението регресия към средното, още през 1869 г. Докато проследява родословните дървета на известни и известни хора, той забелязва, че потомците на известни хора са по-малко известни. Децата им може да са наследили великите музикални или интелектуални гени, които са направили родителите им толкова известни, но те рядко са били толкова известни като родителите си. По-късно изследванията разкриват същото поведение при височината: необичайно високите хора имат деца, които са по-средни; и необичайно ниските родители имаха деца, които обикновено бяха по-високи.

Този ефект може да се види в много ситуации:

Изключително привлекателните хора са склонни да се женят за привлекателни партньори, но не толкова привлекателни като себе си.
Студентите с най-лоши средносрочни оценки са склонни да се справят зле на последния изпит, но не толкова зле, колкото в началото.
Когато икономист проектира подписен фонд, изборът му от най-успешните акции през последните три години едва ли ще бъде най-успешният запас през следващите три години.
Отборите, които играят необичайно добре една лига година, обикновено се справят по-зле през следващия сезон.

Това явление се наблюдава във всяка поредица от събития, в които е замесен случайността: много добри или лоши резултати, високи или ниски резултати, екстремни събития и т.н. те са склонни да бъдат последвани от по-средно представяне или по-малко екстремни събития. Ако се справим изключително добре, най-вероятно ще се справим следващия път, докато ако се справим много зле, следващия път ще се справим по-добре.

Това е статистическа закономерност, известна като регресия към средната стойност: статистическата тенденция, която, когато всякакви две променливи са несъвършено корелирани, екстремните стойности на една от тях са свързани с по-малко екстремни стойности на другата.

Внимателен! Регресията към средната стойност не трябва да се разглежда като естествен закон. Това е просто статистическа тенденция. И може да мине много време, преди да се прояви.

Екстремното поведение обикновено е последвано от по-малко екстремно поведение

За да разберем регресията към средното, първо трябва да разберем концепцията за корелация. Коефициентът на корелация между две мерки, който варира между -1 и 1, е мярка за относителното тегло на факторите, които те споделят. С други думи, две променливи (A и B) са взаимосвързани помежду си, ако с намаляването на стойностите на A намаляват и тези на B и обратно. Разбира се, важно е да се подчертае това корелацията между две променливи не предполага причинно-следствена връзка между тях.

Например, през лятото се увеличава консумацията на сладолед, а също и броят на удавящите се в морето. Корелацията между двете променливи е почти перфектна: дните с най-голяма консумация на сладолед съвпадат с тези с най-голям брой удавяния. Означава ли тази корелация, че яденето на сладолед причинява смърт чрез удавяне в морето? Недей! Това само показва, че в много горещи дни се увеличава консумацията на сладолед и къпането в морето. И разбира се, колкото повече хора се къпят, толкова по-вероятно е някой да се удави.

Нека сега разгледаме статистическа променлива, която следва нормално разпределение, например височината на популацията, представена в следващата графика. Екстремните стойности са по-далеч от средната стойност, докато стойностите, близки до средната, са по-често срещани от стойностите, по-големи от средната. Този модел е с форма на камбана: по-голямата част от населението има средна височина, докато колкото по-голяма е височината, над или под средната, толкова по-малко индивиди ще видим с тази височина.

Ако седите на тераса и пиете бира с някои тополови горички и видите много, много висок индивид, който минава, най-вероятно следващият човек, който минава, е с по-нормална височина. Това е ефектът на регресия към средното в действие.

Когато вземете предвид регресията към средното, вашите мерки за сигурност може да не работят толкова добре, колкото си мислите

Трябва да бъдем особено внимателни при регресия към средната стойност, когато се опитваме да установим причинно-следствена връзка между два фактора. Когато корелацията е несъвършена, най-доброто винаги ще се влоши, а най-лошото ще се подобри с времето, независимо от допълнителна намеса. Основните медии и понякога дори обучени учени се пренебрегват.

В наръчник по социална психология авторите предлагат следния инцидент във Великобритания, за да илюстрират значението на евристиката на репрезентативността и регресията към средното:

Този случай беше много противоречив и можете да намерите повече информация в по-късни проучвания, които анализират фактите.

Разбира се, регресия към средната стойност може да е налице след всяка намеса за сигурност: леко подобрение в честотата на инцидентите в сигурността се дължи на последната актуализация на политиката; на Управителният комитет на компанията може да държи вашата CISO отговорна за намаленото ниво на съответствие на уеб сървъра след отлична дейност по корекция и бастинг преди три месеца и т.н. Или беше регресията към средната стойност?

Често погрешно приписваме причината за ефект на конкретна политика или намеса, когато промяната в крайните групи така или иначе би настъпила. Ще бъдат предложени причинно-следствени обяснения, когато се открие регресията, но те ще бъдат погрешни, защото истината е, че регресията към средната стойност има обяснение, но няма причина.

Тази ситуация представлява основен проблем: Как можем да разберем дали ефектите след намеса за безопасност са реални или просто поради статистическа променливост?

Заблудата на регресията към средната стойност

Заблудата на регресията се определя като неспособността да се разпознае влиянието на регресионния ефект и да се предложи причинно-следствена теория за това, което всъщност е проста статистическа закономерност:

Първо, не очакваме ефект на регресия в много контексти, където е вероятно да се случи. Ако бъдете помолени да предскажете следващия резултат след екстремна стойност, често игнорираме регресията към средната стойност и правим нерегресивни или само минимално регресивни прогнози. Казано по друг начин: предсказваме подобна стойност.
Второ, когато признаем настъпването на регресия, ние се поддаваме на повествователната заблуда и често измисляме сложни и излишни причинно-следствени обяснения, за да я оправдаем.

Както обяснява Даниел Канеман в Think Fast, Think Slow:

„Регресивните ефекти са повсеместни и затова си представяме причинно-следствени истории, за да ги обясним. Добре известен пример е „Sports Illustrated Curse“, твърдението, че спортист, чиято снимка се появява на корицата на списанието, е обречен да се представи слабо през следващия сезон. Прекомерната самоувереност и натискът от високите очаквания често се предлагат като обяснения. Но има по-просто обяснение за това проклятие: спортист на корицата на Sports Illustrated трябва да се е представил изключително добре през предходния сезон, може би с помощта на късмет и късметът е непостоянен. "

Такива случаи на регресия към средната стойност се случват винаги, когато в резултат има елемент на случайност.. Всъщност самият Канеман предлага следната система от уравнения:

Успех = талант + късмет.

Голям успех = малко повече талант + много късмет.

Защото умът прави прогнози въз основа на представителност, често ни се струва изненадващо, че резултатите отстъпват към средното и измисляме обяснения, които нямат нищо общо с регресията, за да осмислим тази изненада.

Канеман и други психолози обясняват това систематично пристрастие в преценката, като твърдят, че хората обикновено приемат, че бъдещите резултати (например продажбите тази година) ще бъдат пряко предвидими от минали резултати (продажби от миналата година). Следователно, ние сме склонни наивно да разработваме прогнози въз основа на предположението за перфектна корелация между минали данни и бъдещи данни. въпреки това, докато корелацията между две стойности е несъвършена, ще има регресия към средната стойност.

Регресията към средната стойност трябва да се има предвид при избора на контрамерка след необичайно голям брой инциденти със сигурност от какъвто и да е тип; и помислете отново по-късно, за да прецените как е бил засегнат броят на сблъсъците след прилагане на мярката за безопасност. За тази цел е необходимо да се изчисли типичната честота на възникване на инциденти без мярката за сигурност, за да се съпостави по-късно със скоростта, с която инцидентите се случват, след като противодействието бъде инсталирано.

На практика основната трудност при прилагането на този метод е идентифицирането на подходяща референтна популация и наблюдението (или моделирането) на свързаното разпределение на вероятностите. Можем да се сравним със средното ниво за индустрията, връстниците от групата на кохортите или историческите нива на подобрение, въпреки че нито едно от тях не е перфектни мерки.

Високо интелигентните жени са склонни да се женят за по-интелигентни мъже от себе си!

Спомняте ли си наблюдението в началото на тази статия?

„Много интелигентните жени са склонни да се женят за по-интелигентни мъже от себе си“.

Ако приемем, че корелацията е несъвършена, вероятността двама съпрузи да представляват най-добрите 1% от населението по отношение на интелигентността (или всяка друга характеристика) е много по-ниска от тази на двойка, в която единият съпруг представлява най-добрите 1%, а другият, долните 99%.

Ако има нещо, което може да се научи от регресията към средното, това е важността да се направи справка с исторически записи (базовата ставка), а не да се разчита на изолирани истории за успех.

Популярен

Те четат сега

Заблудата на регресията към средната стойност или защо мерките за сигурност може да не работят толкова добре, колкото изглеждат

От много високи родители, по-малко високи деца

Екстремното поведение обикновено е последвано от по-малко екстремно поведение

Когато вземете предвид регресията към средното, вашите мерки за сигурност може да не работят толкова добре, колкото си мислите

Заблудата на регресията към средната стойност

Високо интелигентните жени са склонни да се женят за по-интелигентни мъже от себе си!