kray_zemli (kray_zemli) wrote,
kray_zemli
kray_zemli

Category:

Ложь, наглая ложь, статистика.

Можно ли верить научным выводам, сделанным на базе статистики? Казалось бы, статистика -- стройная математическая теория? А вот фиг! Математический аппарат статистики выдвигает нетривиальные требования к выборке. На практике же, качество выборки обычно лишь постулируется, и совсем не обосновывается. Физики вообще придумали себе термин "систематическая ошибка", куда, как грязь под ковёр, прячут неадекватность качества выборки.

Простейший пример, пусть и умозрительный.

Пусть у нас есть две стенки, между которыми заключен газ. И мы хотим померить давление газа на поверхность. У нас есть датчик, который регистрирует все соударения молекул со стенкой. Ударилась молекула, отскочила -- и у нас на графике пик, высота которого пропорциональна импульсу, переданному стенке.

Проводим измерение некоторое время. Потом находим площадь под кривой (т.е. суммируем все пики), делим на время и площадь датчика. Проще говоря, производим усреднение. Получается давление. Всё просто.

А как найти дисперсию измеренной величины?

Можно, например, рассуждать так. В наших условиях должна хорошо работать стандартная кинетическая теория для идеального газа, основанная на одночастичной функции распределения. Там постулируется, во-первых, что параметры параметры наугад выбранной пары молекул будут статистически независимы. И во-вторых, что через время порядка среднего времени между столкновениями, система забывает свою предысторию.

Короче говоря, беглый осмотр теоретических основ придаёт смелости в том, чтобы считать параметры всех соударившихся с датчиком частиц статистически независимыми. И тогда есть легко выводимая формула для дисперсии, куда войдёт количество столкнувшихся молекул, их среднеквадратический импульс, время наблюдения.

А что если параметры частиц на самом деле статистически зависимы? В реальности-то у нас не бесконечно много молекул в системе, а просто очень много: ровно N штук, и корреляции их параметров меду собой имеют порядок 1/N. Много это или мало?

Вообще-то это не важно. Если бы мы знали, допустим, автокорреляционную функцию измеренной нами временной зависимости, то из него вполне можно найти поправочный коэффициент дисперсии. Для этого нужно умножить автокорреляционную функцию на равнобедренный треугольник, ширина основания которого равна времени наблюдения, и посчитать интеграл. То есть, грубо говоря, это второй интеграл автокорреляционной функции.

Ну что же, берём намеренную зависимость давления от времени и строим автокорреляционную функцию. Ожидаемый дельта-пик в нуле. И какой-то невнятный шум вокруг, из которого фиг что выловишь. Казалось бы, можно забить на корреляции и дальше считать все столкновения независимыми. Но мы проявим упрямство и таки проинтегрируем автокорреляционную функцию дважды. И видим чудо: ранее тонувший в шумах невнятный сигнал после интегрирования стал вполне видимым. И найденный поправочный коэффициент дисперсии оказывается намного больше единицы.

Проявляем заинтересованность и строим зависимость поправочного коэффициента дисперсии от длительности наблюдения (тут заранее нужно сказать, что качество автокорреляционной функции, полученное из экспериментальной выборки, позволит уверенно построить такую зависимость лишь на временах, очень малых по сравнению с длительностью эксперимента, дальше шумы таки возьмут своё).

Сначала всё хорошо. На совсем малых временах поправочный коэффициент единица. Начиная где-то со среднего времени между столкновениями, дисперсия начинает неуверенно подрастать. И вот, на совсем уж макроскопических временах, развиваются колебания коэффициента дисперсии, но тренд уверенно повышательный, выходящий на полочку совсем не скоро.

Сюрприз?

Не совсем. Увлёкшись статистическим колдунством и кинетическим теоретизированием, мы забыли простой факт: наша система имеет макроскопические свойства. И флуктуации, которые в ней возникают, тоже вполне себе макроскопические. Отскочила молекула от датчика сильнее среднего -- значит, получила от него повышенный импульс и отдала его газу. Т.е. спровоцировала звуковую волну, которая через некоторое время отразится от противоположной стенки и вернётся обратно на пластину с датчиком, и тогда молекулы будут стучать об неё с повышенным импульсом. И чем выше добротность системы, тем больше раз эта волна слетает туда-сюда, и тем выше будет предел, к которому устремится поправочный коэффициент дисперсии.

Итак, если вести наблюдение достаточно долго по сравнению с макроскопическим временем, реальная дисперсия будет многократно выше той, которую можно было бы ожидать, предполагая (разумно, казалось бы) независимость частиц. Легко ошибиться на порядки!

Вы всё ещё верите в генетику и естественный отбор? Тогда вы идём к вам!
Subscribe

  • Либеральная партия

    Конечно, либералы победят. Их победа давно запланирована, они ждут своего часа и лишь притворяются оппозицией, поскольку они — дети и…

  • Кто в молодости... нет сердца, кто в зрелости... нет мозгов.

    Написал в КПРФ и СР о своём желании быть выдвинутым в депутаты ГД (а почему бы и нет?). Пока что как-то непонятно всё. А тут ЕР продлила своё…

  • Две страны, одна система

    Перестройка и реформы 90-х — неудачная попытка повторить китайский путь. В Китае делали примерно всё то же самое. Одна страна — две системы:…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 8 comments