Корелацията не доказва причинно-следствена връзка

Как да четем изследвания?

Често срещаме данни за корелация между две неща. Най-вече в медиите с лека ръка обясняват как "учените свързали Х със У". Това било добро за очите, онова било вредно за паметта. "Хората, които правят Х, са най-успешни в У". Звучи ли ви познато? В статията ще научите на какво трябва да обърнете внимание когато четете изследвания или сензационни журналистически статии в масовите медии.

Епидемиологични изследвания

Статия със строго научна информацията за математиката и статистиката зад такъв тип изследвания няма да има практическа полза за читателите на BB-Team. Затова тук ще дадем някои семпли определения и после с примери ще подкрепим теза.

Какво е епидемиологично изследване?

Най-просто казано, това е анализ, които събира огромно количество данни за голям брой индивиди и търси корелация между два или повече параметъра. A корелацията е математически термин, с който в общ смисъл се означава мярка за стохастична (вероятностна, нефункционална) зависимост между случайни величини (6). Например, когато увеличаваш нещо, другото също расте. Когато първото намалява, спада и второто, т.е. има корелация между двете.

Пример за епидемиологично изследване:

Събираме данни за 10 000 души. Половината от тях са пушачи, а другата - не. Гледаме на каква възраст средно умират от първата група, а след това правим същото за втората. Накрая правим извода, че тези, които пушат, корелират с по-ранна смърт.

Какво показват този тип изследвания?

Те служат за установяване на корелация между два или повече параметъра. Показват потенциал за връзка между причина и следствие. Изводите от тях се използват за формулиране на хипотези, които следва да бъдат тествани в контролирана обстановка.

Какво НЕ показват?

Епидемиологичните изследвания не са доказателство за причинно-следствена връзка. Показват, че е възможна, но не доказват, че е факт.

Графични примери

Разгледайте следните три графики:

1. Корелация: 97%

Разчитане на изследвания

2. Корелация: 99%

Разчитане на изследвания

3. Корелация: 99%

Разчитане на изследвания

Умишлено съм премахнал обозначенията на абсцисите и ординатите. Връзката между всеки чифт криви е очевидна. Когато едната слиза, слиза и другата. Когато едната се качва, втората я следва. Логично е да предположим, че двата параметъра са свързани и между тях съществува причинно-следствена връзка. Т.е., едното води до другото.

Дотук всичко е ясно, но ето какво се сравнява:

В графика 1:

  • хора, починали поради оплитане в чаршафите си (да, знам)
  • обща печалба в САЩ от скиорски съоръжения

В графика 2:

  • разходи на САЩ за наука, космос и технология
  • брой самоубийства чрез обесване и задушаване

В графика 3:

  • разводи в щата Мейн
  • консумация на маргарин на глава от населението за САЩ

Сега трябва да е очевидно, че корелация между две неща НЕ доказва връзка между тях. Примерите от графиките са абсурдни, за да е по-ясно съобщението. Тестовете показват връзка между две измерения. Дали те имат връзка помежду си, е друг въпрос.

Корелация между две неща НЕ доказва връзка между тях.

Каква ни е практическата полза да знаем всичко това?

Наскоро се вдигна много шум около едно епидемиологично (в голямата си част) изследване (1). То показва, че са възможни определени зависимости между високопротеинова диета при възрастни хора (над 66 години) и рискови фактори като диабет тип 2, ракови и сърдечно-съдови заболявания.

Какъв извод си направиха медиите? "Високата консумация на протеин е също толкова опасна, колкото пушенето на цигари!" (2). Да, това се разпространи навсякъде. Сега, след като вече довършвате текущата статия, знаете повече, отколкото журналистът, написал и разпространил тази глупост.

Това, че някой някъде е видял връзка между две неща, не доказва причинно-следствена такава. Дава интересна информация и база за изграждане на хипотеза, която чрез контролиран опит да бъде потвърдена или отхвърлена, но не повече.

Същото важи и за статиите из вестниците, където обясняват как "учени открили”" че вегетарианският начин на живот води до по-добро здраве. Това, че вегетарианците често са в по-добро здравословно състояние не означава, че премахването на месото е причината за това, въпреки че връзката изглежда логична.

Епидемиологично изследване ще покаже, че липса на консумация на месо корелира с по-добро здравословно състояние. Проблемът е, че няма да ви каже, че вегетарианците най-често упражняват друг начин на живот, включващ консумацията на повече плодове и зеленчуци (и съдържащите се в тях фибри, минерали и витамини), не пушат, не пият, не водят заседнал начин на живот и като цяло са по-загрижени за здравословното си състояние (4), (5).

Подобна ситуация може да се забележи при данните за консумация на наситени мазнини. Корелационните изследвания с голяма значимост твърдят, че високият прием на мазнини и наситени такива води до сърдечно-съдови заболявания.

Ако се разгледат директни контролирани изследвания, то значима връзка няма. Разминаването идва от това, че хора, които типично ядат наденици, суджуци и кебапчета най-често не спортуват, водят заседнал живот и не обръщат голямо внимание на здравето си. Така има корелация, но няма причинно-следствена връзка.

Следващия път когато прочетете, че нещо е "вредно" или "полезно", имайте едно-две наум. И това, че по-голямата част от най-заможните милиардери на планетата нямат висше образование не значи, че прекъсвайки след гимназията, ще имате по-голям шанс да пиете кафето си с Уорън Бъфет.

В статията са използвани източници - виж списъка.

Хареса ли ти?

Сподели с приятели в:

back-arrowbb-hexcalendarcheckoutfacebook-iconforumgoogle+instagramlinkedinlogo-smallmailmessagesmy-bbprofileprogressreadingsearchseparator-carrotseparator-dumbbellseparator-shoeservicestoresubmit-arrowtop-arrowtwitteryoutube1 read-later1