Нормальное распределение и центральная предельная теорема.

Здесь приведена численная иллюстрация центральной предельной теоремы. То есть показано, что сумма большого количества случайных величин равномерно распределенных на отрезке, близка к случайной величине с нормальным распределением вероятности. Для изменения иллюстрирующих примеров выборок обновите страницу (F5).

Случайные выборки с равномерным распределением вероятности.


Назовем частотой появления значений меньших y из выборки x отношение количества чисел в выборке, меньших чем y, к длине выборки.
Например, возьмем выборку: .
Среди чисел из этой выборки есть , меньших чем .
То есть частота появления чисел, меньших чем , равна

Обозначим количество чисел в выборке x, удовлетворяющих условию \(x\le y\), как \(\text{mes}\{x\le y \}\). Тогда количество чисел во всей выборке можно обозначить(\(\text{mes}\{x\in\mathbb{R}\}\)). Частота появления значений меньших y в выборке x есть отношение количества чисел в выборке, меньших чем y к длине выборки:

\( P(x\le y)=\frac{\text{mes}\{x\le y\}}{\text{mes}\{x\in\mathbb{R}\}}. \)

Возьмем случайный набор из натуральных чисел со значениями от -1 до 1. Построим график распредения частоты для выборки x



Очевидно, что \(P({\bf x}\le-1)=0\) и \(P({\bf x}\le 1)=1\). Здесь используется выборка, построенная по равномерному закону распределения (см. ниже). График частоты распределения должен быть близок к прямой, соединяющей точки (-1,0) и (1,1)

Плотностью частоты попадания случайной величины x в интервал \((y-h,y+h)\), где \(h\) некоторое положительное число, т.е. \(h>0\), будем называть отношение количество чисел из выборки x в заданном диапазоне (обозначим их число как \(\text{mes}\{{\bf x}\in(x-h,x+h)\}\)) к общему количеству чисел в выборке, помноженному на длину диапазона (\(2*h\,\text{mes}\{{\bf x}\in\mathbb{R}\}\)). Плотность частоты можно выразить через частоту \(P({\bf x}\le y)\):

\( F({\bf x}\in(y-h,y+h))=\frac{P({\bf x}\le y+h)-P({\bf x}\le y-h)}{2 h}. \)

Например, возьмем выборку: и диапазон длиной 0.2, то есть (h=0.2/2=0.1).
Среди чисел из этой выборки есть , меньших чем и , меньших, чем
То есть плотность распределения частоты в окрестности y=:

\(F({\bf x}\in(\)\( ))=\)( - )/0.2=.

Построим график распредения плотности частоты для выборки x из натуральных чисел со значениями меньше от -1 до 1. График будем строить с шагом 0.1, величина \(h=0.1\)



График плотности распределения частоты лежит около горизонтальной прямой, то есть близок к постоянной. Здесь этой постоянной должна быть величина 0.5.

Вероятностью распределения случайной величины будем называть предел функции \(P(x\le y)\) при длине выборки \(N\to\infty\).

Плотностью вероятности распределения случайной величины будем называть предел функции \(F(x\in(y-h,y+h))\) при длине выборки \(N\to\infty\) и \(h\to0\), если такой предел существует.

Случайную величину будем называть равномерно распределенной на интервале \((a,b)\), если она принимает значения только из интегрвала \((a,b)\) и её плотность распредения вероятности на этом интервале постоянна и равна \(\frac{1}{b-a}\).

Иллюстрация центральной предельной теоремы

Рассмторим сумму из <<большого>> количества (на самом деле здесь из ) выборок равномерно распределённых случайных величин одинаковой длины из каждая.



Центральная предельная теорема утверждает, что отношение суммы N случайных выборок к \(\sqrt{N}\) должно иметь нормальное рапределение -- то есть плотность должна быть близка по форме к кривой черного цвета.