Случайные выборки

Возьмем выборку x из случайных чисел из отрезка [0,1].
Пять первых чисел в случайной выборке x:




Для изменения выборки обновите страницу (F5).

Среднее значение

Среднее значение чисел из этой выборки вычисляется по формуле:

\( M(x)=\frac{x_1+x_2+...+x_N}{N}. \)



Отклонение от среднего значения \( s_i=x_i-M(x)\):



Среднеквадратичное отклонение

Среднее квадратичное вычисляется по формуле:

\( \sigma(x)=\sqrt{\frac{(x_1-M(x))^2+(x_2-M(x))^2+...+(x_N-M(x))^2}{N}}. \)

Для выбранной выборки
\(\sigma(x)=\)

Ковариация

Ковариация и связанное с ней понятие корреляция показывают, есть ли какая-то " скрытая " зависимость между двумя случайными выборками одной длины. Ковариация вычисляется по формуле:

\( C(x,y)=M((M(x)-x)\,(M(y)-y)). \)

То есть это среднее от суммы произведений отклонений от средних двух выборок.
Численное значение ковариации оказывается пропорциональным численным значениям отклонений от средних значений обеих выборок. Для оценки взаимозависмости выборок случайных величин удобнее использовать относительную величину, которая называется корреляцией:

\( \text{Cor}(x,y)=\frac{C(x,y)}{\sigma(x)\,\sigma(y)}. \)

Ковариация независимых величин

Возьмем в дополнение к выборке x еще одну выборку y случайных чисел. Пять первых чисел в случайной последовательности y:

Среднее этой выборки:
M(y)=




Отклонение от среднего значения \( t_i=y_i-M(y)\):



Величина среднеквадратичного отклонения:
\(\sigma(y)=\)

Рассмотрим произведение отклонений от средних значений \( z_i=(x_i-M(x))(y_i-M(y))=s_i t_i\):



Ковариация для выборок x и y
\( C(x,y)= z_1+z_2+\dots+z_N = \)
Корреляция для выборок x и y
\( \hbox{Cor}(x,y)=\frac{C(x,y)}{\sigma(x)\sigma(y)}=\)
Величина корреляции оказалась близка к нулю. Это показывает, что выборки, скорее всего, независимы.

Ковариация зависимых величин

Теперь возьмем выборку a, явно зависящую от x:

\( a_i=\frac{x_i+3}{x_i-4}. \)

Пять первых чисел в выборке a:

Среднее выборки a:
M(a)=;


Среднеквадратичное отклонение:
\(\sigma(a)=\).
Величины в выборке a явно отличаются от величин выборки x. Рассмотрим корреляцию между выборками x и a.

Произведение отклонений от средних значений \( v_i=(x_i-M(x))(a_i-M(a))=s_i u_i\):



Тогда ковариация оказывается малой:
\(C(x,a)=v_1+v_2+\dots+v_N=\).

Однако, корреляция из-за нормирования на \(\sigma(x)\sigma(a)\): \( \hbox{Cor}(x,a)=\frac{C(x,a)}{\sigma(x)\sigma(a)}=\),
оказывается существенно отличной от нуля и следует ожидать, что величины x и a зависимы.