Отправляет email-рассылки с помощью сервиса Sendsay
←  Предыдущая тема Все темы Следующая тема →
Привилегированный участник пишет:

Продолжим рассказ о статистике

 

 

Магия больших чисел

Есть что-то мистически завораживающее в больших числах, особенно если это касается гибели людей. Эту нашу особенность активно эксплуатируют СМИ и популисты всех мастей.

Каждый год в России в ДТП гибнут от 20 до 35 тысяч человек. С 2000 по 2016 год погибло 499 тысяч человек. По 80 человек в среднем в день. Настоящая война — полмиллиона за 17 лет! При этом здесь не учитывается количество умерших от травм спустя некоторое время после аварий. А также не учитываются покалеченные люди. Для сравнения за 10 лет войны в Афганистане безвозвратные потери советских войск составили 15 тысяч человек. Погибнуть в ДТП — одна из наиболее вероятных неестественных смертей. Цифры ужасают.

Какой же вид транспорта наше население считает самым опасным? Конечно же, авиацию. После каждой очередной авиакатастрофы тысячи людей зарекаются — на самолеты ни ногой! Посмотрим, сколько же человек гибнет в авиакатастрофах. За 66 лет (с 1946 по 2012 год) в различных авиакатастрофах на территории СССР и РФ погибло 6,5 тысячи человек. Цифра немаленькая. Но давайте сопоставим: 6500 жертв за 66 лет и 500 тысяч жертв за 17 лет. Несколько сотен в год против 25 тысяч.

Все дело в том, что в ДТП обычно гибнет немного людей за раз. Гибнут часто, гибнут каждый день, и за год набегает ужасная цифра. Но об этом мало говорят по телевизору. А в авиакатастрофах обычно погибает много людей сразу: 50, 100, 200. Это и оказывает такое будоражащее воздействие. Мы не утверждаем, что авиаперелеты полностью безопасны. Но есть ли повод для паники? И что на самом деле опаснее: сесть на самолет или отправиться с друзьями на машине в соседний город?

Аналогичный анализ можно провести и с жертвами терактов. Теракты — это одна из самых любимых тем для политических спекуляций в любой стране мира. Как правило, террористы достигают главной своей цели — запугать население. Но, отринув эмоции, давайте попробуем выяснить: от чьих рук погибнуть у нас самая высокая вероятность? Это упражнение я оставлю желающим для самостоятельного разбора. Оцените количество жертв терактов за год на территории России. А потом посмотрите количество самоубийств и количество жертв бытового насилия за этот же период.

«Из-за врачебных ошибок ежегодно гибнут десятки тысяч людей даже в развитых странах. Мой знакомый специалист по акупунктуре не убил ни одного. Значит, традиционная медицина гораздо менее опасна». Давайте разберемся. Десятки тысяч? Да, действительно, цифры впечатляют. Но разумны ли выводы? Как мы сравниваем? На сколько клинических случаев врачебного вмешательства приходятся эти десятки тысяч смертей? На десятки миллионов? А кто ведет статистику смертей после неудачных сеансов альтернативной медицины? Идет ли диагностика после лечения, отслеживание состояния пациента? Все ли мы учитываем? Сами альтернативщики будут утверждать, что не убили ни одного пациента. Но так ли это на самом деле?

В Интернете периодически популяризируется идея домашних родов. Довольно высокий процент людей разделяет опасные идеи о естественности, безопасности и правильности домашних родов. Когда дело доходит до самого процесса, слава богу, у большинства из них хватает здравомыслия не отказываться от госпитализации, но сама идея на слуху — значит, у нее много сторонников. К примеру, сообщества по данной тематике ВКонтакте насчитывают от 2 до 13 тысяч участников. Один из центральных тезисов «доморожениц» — клинические роды опасны. И действительно, периодически в СМИ всплывают резонансные случаи смерти рожениц в роддомах. Но что говорит статистика? На 2015 год показатель материнской смертности в России — 10,1 на 100 тысяч родов. Печальные цифры. Ими даже можно запугивать население — спасибо нашим СМИ («Врачи убили очередную роженицу»). Если учесть, что за этот год родилось около 2 миллионов человек, то получится, что при родах погибли почти 200 матерей4. А какова статистика смертей при домашних родах? Какие выводы нам делать, если она достигает 21 смерти на 10 тысяч рождений? Если с официальной медициной в стране все не идеально, следует ли отсюда вывод, что альтернативная медицина справится с проблемами лучше? Нет, не следует.

Нормальное распределение

Нормальное распределение (или распределение Гаусса) — упрощенно говоря, это такое распределение в теории вероятностей, при котором среднее значение некоторого условного признака встречается чаще всего. А отклонения от средней величины встречаются тем реже, чем значительнее эти отклонения. В этом контексте можно сказать, что «норма» (среднее значение) — это понятие большинства.

Например, для людей определенного возраста и определенного пола существует норма массы тела — то есть некое среднее значение, которому соответствует большинство людей (не путайте с рекомендуемой здоровой нормой). При этом могут встретиться и люди с массой сильно больше нормы, и люди с массой сильно меньше нормы. Если в обществе возникает определенная социальная проблема — например, голод или ожирение, то и среднее значение массы (норма) будет смещаться в большую или меньшую сторону. Но общий вид кривой нормального распределения сохранится.


Картинки по запросу Глава 34. Статистика на службе науки нормальное распределение

 

Нормальному распределению подчиняются самые разнообразные множества объектов: рост людей, вес производимого изделия на фабрике, оценки по какому-то предмету у всех учеников в классе (если, конечно, оценки не рисуются «от балды»). Любой навык человека подчиняется нормальному распределению: это значит, большинство людей, обладающих этим навыком, умеют им пользоваться на среднем уровне, но встречается небольшое количество особо талантливых, и есть небольшое количество совсем бестолковых.

Когда мы читаем про очередного номинанта на премию Дарвина, самоубившегося самым невероятным способом, мы можем сказать, что это представитель крайней левой части кривой нормального распределения по интеллекту (или, если хотите, по удачливости). А если мы смотрим передачу про вундеркинда, запоминающего первые 10 тысяч цифр числа «пи» — перед нами очевидно представитель крайней правой части этой кривой. И в принципе, никакой мистики тут нет. Людей на планете очень много, среди них встречаются и поистине удивительные. Если мы возьмем большую группу людей (скажем, несколько миллионов), то в ней может оказаться несколько тысяч особо талантливых — а это, согласитесь, значительная цифра.

Возраст и здоровье — такие же примеры нормального распределения. Кто-то умрет в младенчестве, кто-то доживет до 110 лет. Все люди разные. Сторонник курения скажет: «Мой дед курил по две пачки в день и дожил до 90 лет». Что должен доказать этот аргумент? Что, может быть, дедушка дожил бы и до 95 лет, если бы не курил? В любом случае, у нас нет возможности вернуться в прошлое, отговорить этого дедушку от курения и дальше 70 лет следить за его здоровьем. Дожить до 90 лет — это нужно быть аномально здоровым. Но, увы, большинству даже здоровых людей так не повезет. А курящему большинству повезет еще меньше.

Однажды, мне довелось посмотреть телешоу про одаренных детей с участием мальчика, который по силуэту линии государственной границы узнает любую страну мира. Очень способный мальчик с очень хорошими родителями. Кто-то из людей, склонных к мистицизму, наверняка скажет, что подобные дети — лучшее доказательство существования новой расы — детей-индиго. Я же буду радоваться другому — что современный Интернет, социальные сети, телевидение способно выискивать удивительно талантливых людей. Ведь таланты есть: среди семи с половиной миллиардов людей на планете Земля найдется большое количество уникальных личностей (Ютуб не даст соврать).

Нерепрезентативность выборки

Одна из расхожих статистических манипуляций — привлечение статистических данных, основанных на изначально некорректно выбранном множестве. Под репрезентативностью понимается соответствие характеристик сделанной нами выборки характеристикам полного множества объектов. Или, говоря проще, насколько изученное нами малое количество объектов отражает особенности всего множества этих объектов.

«Я не голосовал за кандидата А. на выборах, мои друзья и мои родственники тоже не голосовали, все, кого я знаю, тоже не голосовали. Какого черта тогда кандидат А. победил?»

Мы опросили 100 человек и выслушали их мнение по нескольким важнейшим политическим или общественным вопросам. Насколько адекватно их ответы отражают общественное мнение в целом? Мы провели исследование эффективности нового лекарства на выборке из 500 человек. Будет ли лекарство так же эффективно и безопасно, когда его выпустят на рынок и оно станет доступно миллионам людей? Нерепрезентативность выборки может быть связана с малым количеством исследуемых объектов (выборка недостаточна для однозначного вывода). Опыт, проведенный на 30 испытуемых, сложно назвать статистически значимым.

Выборка может быть неслучайной, например, если при социологическом опросе интервьюируют только людей одного пола, или определенного возраста, или определенного социального положения и/или этнической принадлежности. К примеру, опрос школьников о вреде курения можно провести только среди старшеклассников (нерепрезентативная выборка), а можно среди школьников разных возрастов (репрезентативная выборка).

Именно для устранения подобных статистических ошибок в медицине проводятся двойные слепые клинические испытания. Если врач сомневается в эффективности тестирумого лекарства, но заранее знает, где будет назначено плацебо, а где проверяемый препарат, то он может отобрать в группу препарата более легких больных. Двойное ослепление препятствует подобным намеренным или неосознанным манипуляциям с выборкой.

Как изменилась грамотность населения России за последние 20 лет? Действительно ли мы стали писать менее грамотно по сравнению с советским периодом или же, как считает лингвист Максим Кронгауз, нельзя судить так однозначно, так как с развитием Интернета письменным общением стало заниматься гораздо большее количество людей. Наверное, здесь действительно лучше провести более глубокое исследование, нежели руководствоваться «очевидностью ситуации вокруг».

Корреляции и причинно-следственные связи

Корреляцией называют статистическую взаимосвязь двух или более явлений, событий или множеств. Подводный камень здесь заключается в том, что два явления, явно коррелирующих друг с другом, не обязательно связаны причинно-следственной связью. То есть вовсе не обязательно одно явление порождает другое. Явления могут совместно порождаться некоей третьей скрытой причиной, либо корреляция и вовсе может оказаться результатом случайности.

Рост процента детей, привитых вакциной от кори, коррелирует с падением уровня заболеваемости корью. И здесь научно доказана причинно-следственная связь, так как описан механизм выработки иммунитета от кори после вакцинирования.

Другой пример корреляции: связь между количеством пожарных, принимающих участие в тушении пожара, и величиной причиненного при пожаре ущерба. Однако нельзя сказать, что причиной увеличения ущерба является увеличение числа пожарных. Оба факта связаны лишь статистически и зависят от третьей, общей причины — масштаба пожара.

«Чем быстрее вращается мельница, тем сильнее скорость ветра» — корреляция имеется, но причинность строго обратная.

Знание основ статистики и наличие компьютера позволяют посчитать множество самых разнообразных корреляций и увидеть совпадения даже там, где их в принципе не может быть. Здесь главное — не торопиться с выводами. Если хорошо покопаться в различных статистических данных, то можно насобирать пары самых причудливых явлений, «волшебным образом» коррелирующих друг с другом. Отыщутся корреляции между «общемировыми некоммерческими запусками в космос и количеством получивших докторскую степень по социологии», «затратами в США на науку, космос и технологии и количеством самоубийств через удушение», «количеством разводов и потреблением маргарина» и многое другое. Этим, например, занимаются на шуточном сайте Spurious correlations.

Для интересующихся разными манипуляциями со статистикой, рекомендую книгу Дарелла Хаффа «Как лгать с помощью статистики».

Источник  http://elementy.ru/bookclub/chapters/434298/Psevdonauka_Glava_iz_knigi

 

Это интересно
0

Привилегированный участник 24.09.2018
Пожаловаться Просмотров: 574  
←  Предыдущая тема Все темы Следующая тема →


Комментарии временно отключены