Взаимодействуя ежедневно в работе или учебе с цифрами и числами, многие из нас даже не подозревают о том, что существует очень интересный закон больших чисел, применяемый, например, в статистике, экономике и даже психолого-педагогических исследованиях. Он относится к теории вероятностей и говорит о том, что среднее арифметическое какой-либо большой выборки из фиксированного распределения близко к математическому ожиданию этого распределения.
Вы, наверное, заметили, что понять сущность этого закона непросто, особенно тем, кто не особо дружит с математикой. Исходя из этого, мы бы хотели рассказать о нем простым языком (насколько это возможно, конечно), чтобы каждый мог хотя бы примерно уяснить для себя, что это такое. Эти знания помогут вам лучше разобраться в некоторых математических закономерностях, стать более эрудированным и положительным образом повлиять на развитие мышления.
Помимо рассмотренного нами выше определения закона больших чисел в теории вероятностей, можно привести и его экономическое толкование. В этом случае он представляет собой принцип, согласно которому частоту финансовых потерь конкретного вида можно предсказать с высокой степенью достоверности тогда, когда наблюдается высокий уровень потерь подобных видов вообще.
Помимо этого, в зависимости от уровня сходимости признаков можно выделить слабый и усиленный законы больших чисел. О слабом речь идет, когда сходимость существует по вероятности, а об усиленном – когда сходимость существует практически во всем.
Если интерпретировать несколько иначе, то следует сказать так: всегда можно найти такое конечное число испытаний, где с любой запрограммированной наперед вероятностью меньше единицы относительная частота появления какого-то события будет крайне мало отличаться от его вероятности.
Таким образом, общую суть закона больших чисел можно выразить так: результатом комплексного действия большого количества одинаковых и независимых случайных факторов будет такой результат, который не зависит от случая. А если говорить еще более простым языком, то в законе больших чисел количественные закономерности массовых явлений будут явно проявляться только при большом их числе (поэтому и называется закон законом больших чисел).
Отсюда можно сделать вывод, что сущность закона состоит в том, что в числах, которые получаются при массовом наблюдении, имеются некоторые правильности, обнаружить которые в небольшом количестве фактов невозможно.
Закон больших чисел выражает наиболее общие закономерности случайного и необходимого. Когда случайные отклонения «гасят» друг друга, средние показатели, определенные для одной и той же структуры, приобретают форму типичных. Они отражают действия существенных и постоянных фактов в конкретных условиях времени и места.
Определенные посредством закона больших чисел закономерности сильны только тогда, когда представляют массовые тенденции, и они не могут быть законами для отдельных случаев. Так, вступает в силу принцип математической статистики, говорящий, что комплексное действие ряда случайных факторов способно стать причиной неслучайного результата. И наиболее яркий пример действия данного принципа – это сближение частоты наступления случайного события и его вероятности, когда возрастает количество испытаний.
Давайте вспомним обычное бросание монетки. Теоретически орел и решка могут выпасть с одной и той же вероятностью. Это означает, что если, к примеру, бросить монетку 10 раз, 5 из них должна выпасть решка и 5 – орел. Но каждый знает, что так не происходит практически никогда, ведь соотношение частоты выпадения орла и решки может быть и 4 к 6, и 9 к 1, и 2 к 8 и т.д. Однако с увеличением количества подбрасываний монетки, например, до 100, вероятность того, что выпадет орел или решка, достигает 50%. Если же теоретически проводить бесконечное количество подобных опытов, вероятность выпадения монетки обеими сторонами всегда будет стремиться к 50%.
На то, как именно упадет монетка, влияет огромное число случайных факторов. Это и положение монетки на ладони, и сила, с которой совершается бросок, и высота падения, и его скорость и т.д. Но если опытов много, вне зависимости от того, как воздействуют факторы, всегда можно утверждать, что практическая вероятность близка к вероятности теоретической.
А вот еще один пример, который поможет понять сущность закона больших чисел: предположим, что нам нужно оценить уровень заработка людей в каком-то регионе. Если мы будем рассматривать 10 наблюдений, где 9 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, среднее арифметическое составит 68 тыс. рублей, что, естественно, маловероятно. Но если мы возьмем в расчет 100 наблюдений, где 99 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, то при расчете среднего арифметического получим 24,8 тыс. рублей, что уже ближе к реальному положению дел. Увеличивая число наблюдений, мы будем заставлять среднее значение стремиться к истинному показателю.
Именно по этой причине для применения закона больших чисел в первую очередь необходимо набрать статистический материал, чтобы получать правдивые результаты, изучая большое число наблюдений. Потому-то и удобно использовать этот закон, опять же, в статистике или социальной экономике.
Значение того, что закон больших чисел работает, сложно переоценить для любой области научного знания, и особенно для научных разработок в области теории статистики и методов статистического познания. Действие закона также обладает большим значением и для самих изучаемых объектов с их массовыми закономерностями. На законе больших чисел и принципе математической статистике основываются практически все методы статистического наблюдения.
Но, даже не беря во внимание науку и статистику как таковые, можно смело сделать вывод, что закон больших чисел – это не просто явление из области теории вероятностей, но феномен, с которым мы сталкиваемся практически каждый день в своей жизни.
Надеемся, теперь сущность закона больших чисел стала вам более понятна, и вы сможете легко и просто объяснить его кому-то другому. А если тема математики и теории вероятностей вам интересна в принципе, то рекомендуем почитать о числах Фибоначчи и парадоксе Монти Холла. Также познакомьтесь с приближенными вычислениями в жизненных ситуациях и самыми популярными числами. И, конечно же, обратите внимание на наш курс по когнитивистике, ведь, пройдя его, вы не только овладеете новыми техниками мышления, но и улучшите свои когнитивные способности в целом, в том числе и математические.
Источник
О законе больших чисел (збч) написано много (например, на английском, тут и тут, также [1]). В этом тексте я попробую рассказать о том, чем закон больших чисел не является – об ошибочном восприятии этого закона и потенциальных ловушках, спрятанных в математических формулировках.
Начнем с того, что же такое закон больших чисел. Неформально, это математическая теорема о том, что «вероятность отклонений среднего по выборке от математческого ожидания мала» и что «эта вероятность стремится к нулю при увеличении выборки». Совсем неформально, теорема утверждает, что с мы можем быть в достаточной степени уверены, что среднее по нашей выборке достаточно близко к «настоящему» среднему и таким образом хорошо его описывает. Разумеется, предполагается наличие традиционного статистического «багажа» — наши наблюдения из выборки должны описывать одно и то же явление, они должны быть независимы, и мысль о том, что есть некоторое «настоящее» распределение с «настоящим» средним, не должна вызывать у нас существенных сомнений.
При формулировке закона мы говорим «среднее по выборке», и все что может быть математически записано как такое среднее, попадает под действие закона. Например, доля событий в общей массе может быть записана как среднее, — нам достаточно записать наличие события как «1» и отсутствие как «0». В итоге среднее будет равно частоте и частота должна быть близка к теоретическому среднему. Именно поэтому по ожидаем, что доля «орлов» при подбрасывании идеальной монеты будет близка к ½.
Рассмотрим теперь ловушки и ошибочные представления об этом законе.
Во-первых, ЗБЧ не всегда верен. Это всего лишь математическая теорема с «входными данными» — предположениями. Если предположения неверны, то и закон не обязан выполняться. Например, это так если наблюдения зависимы, или если нет уверенности в том, что «настоящее» среднее существует и конечно, или если изучаемое явление меняется во времени и мы не можем утверждать, что мы наблюдаем одну и ту же величину. По правде говоря, в определенной степени ЗБЧ верен и в этих случаях, например, для слабокоррелированных наблюдений или даже в том случае когда наблюдаемая величина меняется во времени. Однако, для корректного приложения этого к непосредственной реальности нужен хорошо тренированный специалист-математик.
Во-вторых, кажется верным, что ЗБЧ утверждает «среднее по выборке близко к настоящему среднему». Однако, такое утверждаение остается не полным: надо обязательно добавлять «с высокой долей вероятности; и эта вероятность всегда меньше 100%».
В-третьих, хочется сформулировать ЗБЧ как «среднее по выборке сходится к настоящему среднему при неограниченном росте выборки». Однако, это неверно, потому что среднее по выборке вообще никуда не сходится, так как оно случайное и остается таковым для любого размера выборки. Например, даже если подбросить симметричную монету миллион раз, все равное есть шанс, что доля орлов будет далека от ½ или даже равна нулю. В определенном смысле, всегда есть шанс получить что-то необычное. Надо признать, однако, что наша интуиция все-таки подсказыает нам что ЗБЧ должен описывать какую-то сходимость, и так есть на самом деле. Только «сходится» не среднее, а «вероятность отклонения выборочного среднего от его истинного значения», и сходится к нулю. Так как эта идея интуитивно очень удобна («шансы увидеть что-то необычное стремятся к нулю»), матетматики придумали для этого особый тип сходимости – «сходимость по вероятности».
В-четвертых, ЗБЧ не говорит ничего о том, когда выборочное среднее можно считать достаточно близким к теоретическому. Закон больших чисел только постулирует существование определенного явления, он ничего не говорит о том, когда его можно использовать. Получается, на ключевой вопрос с точки зрения практики — «могу ли я использовать ЗБЧ для моей выборки размера n?», закон больших чисел не отвечает. Ответы на эти вопросы дают другие теоремы, например, Центральная Предельная Теорема. Она дает представление о том, в каких пределах выборочное среднее может отклоняться от своего истинного значения.
В заключение следует отметить центральную роль ЗБЧ в статистике и теории вероятностей. История этого закона началась тогда, когда ученые заметили, что частоты некоторых повторяющихся явлений стабилизируются и перестают существенно меняться, при условии многократного повторения опыта или наблюдения. Поразительным было то, что эта «стабилизация частот» наблюдалась для совершенно несвязаных явления – от бросания игральной кости до урожайности в сельском хозяйстве, указывая на возможное существование «закона природы». Интересно, что этот закон природы оказался частью математики, а не физики, химии или биологии, как обычно бывает с законами природы.
[1] Illustrating the Law of Large Numbers (and Confidence Intervals) Jeffrey D Blume & Richard M Royall
Источник