Среднее квадратичное отклонение: формула, примеры и понятие

Среднее квадратичное отклонение - одна из важнейших статистических характеристик, позволяющая оценить степень вариации значений случайной величины относительно ее математического ожидания. Другими словами, этот показатель показывает, насколько сильно значения разбросаны вокруг среднего.

Определение среднего квадратичного отклонения

Формальное определение среднего квадратичного отклонения звучит так: это квадратный корень из дисперсии случайной величины. Дисперсия в свою очередь представляет собой математическое ожидание квадрата отклонения случайной величины от ее среднего значения:

σ = √D, где D = M[(X - M(X))2]

Где:

  • σ - среднее квадратичное отклонение
  • D - дисперсия
  • X - случайная величина
  • M(X) - математическое ожидание X

Из этого определения видно, что среднее квадратичное отклонение измеряется в тех же единицах, что и сама случайная величина X. Чем выше значение σ, тем сильнее варьируют значения вокруг математического ожидания.

Вывод формулы

Формулу для вычисления среднего квадратичного отклонения можно получить, исходя из вышеприведенного определения дисперсии:

Где xi - отдельное значение случайной величины, n - число наблюдений. Подставляя это выражение для дисперсии D в формулу определения среднего квадратичного отклонения, получаем итоговую формулу:

Для удобства вычислений на практике часто используют другой вариант формулы, в котором вынесен множитель (1/n-1):

Применение формулы на практике

Рассмотрим применение формулы среднего квадратичного отклонения на практическом примере. Пусть имеется следующая выборка значений некоторой случайной величины:

5 7 4
2 6 3

Сначала найдем среднее арифметическое этих значений:

x̄ = (5 + 7 + 4 + 2 + 6 + 3) / 6 = 4

Теперь подставляем значения в формулу среднего квадратичного отклонения:

Полученное значение σ = 1,63 показывает среднюю величину отклонения значений от среднего. Чем меньше σ, тем значения группируются ближе к среднему.

Вычисление среднего квадратичного отклонения в Excel

Расчет среднего квадратичного отклонения можно выполнить в табличном процессоре Excel с использованием встроенных функций.

Алгоритм расчета

  1. Ввести исходные данные в столбец или строку таблицы
  2. Для вычисления среднего использовать функцию СРЗНАЧ
  3. Для вычисления среднего квадратичного отклонения использовать функцию СТАНДОТКЛОН

Например, если исходные данные находятся в ячейках A2:A7, то среднее вычисляется по формуле =СРЗНАЧ(A2:A7), а среднее квадратичное отклонение - по формуле =СТАНДОТКЛОН(A2:A7).

Графическая интерпретация

Полученное в Excel значение среднего квадратичного отклонения можно проинтерпретировать графически с помощью диаграммы размаха. Для этого:

  1. Построить диаграмму с усами на основе исходных данных
  2. На ней отобразить среднее значение и среднее квадратичное отклонение
  3. Среднее квадратичное отклонение будет соответствовать примерному размаху усов

Таким образом можно визуально оценить степень разброса значений.

Автоматизация расчетов в Excel по формуле расчета среднего квадратичного отклонения

Для автоматического пересчета среднего квадратичного отклонения при изменении исходных данных можно использовать опцию Excel под названием "Таблица данных". Чтобы создать Таблицу данных:

  1. Выделить ячейки с исходными данными
  2. Перейти на вкладку "Вставка" и нажать "Таблица"
  3. В формулах использовать ссылки на всю область Таблицы, например: =СТАНДОТКЛОН(Table1)

При этом значения в формулах будут автоматически пересчитываться при любых изменениях Таблицы данных.

Формула расчета среднего квадратичного отклонения по 44 фз

В российском законодательстве упоминание о расчете среднего квадратичного отклонения встречается в статье 22 44 фз "О контрактной системе в сфере закупок товаров, работ, услуг для обеспечения государственных и муниципальных нужд".

В частности, при обосновании цены контракта заказчик вправе применить метод удаления крайних значений - отбросить 20% минимальных предложений цены и 20% максимальных предложений цены. После этого рассчитать среднее квадратичное отклонение для оставшихся предложений. Если отклонение превышает 33%, заказчик вправе признать расчет необоснованным.

Критерии оценки величины отклонения

Для оценки степени вариации исходя из полученной величины среднего квадратичного отклонения используют следующие эмпирические критерии:

  • Отклонение меньше 10% - незначительный разброс
  • От 10% до 20% - умеренный разброс
  • Более 20% - высокий разброс значений

Таким образом, можно количественно охарактеризовать степень вариации исходных данных.

Нормальное распределение и среднее квадратичное отклонение

Среднее квадратичное отклонение тесно связано с одним из важнейших в теории вероятностей законов - нормальным распределением. Нормальное распределение полностью описывается двумя параметрами: математическим ожиданием и средним квадратичным отклонением.

Благодаря этому, зная σ для нормально распределенной случайной величины, можно построить ее функцию плотности распределения и найти вероятность попадания значений в тот или иной интервал.

Правило трех сигм

В связи с нормальным распределением часто используется так называемое правило трех сигм. Суть его в том, что интервал [М(Х) - 3σ, М(Х) + 3σ] содержит около 99,7% всех значений случайной величины.

Это позволяет, например, исключать выбросы в данных - значения, выпадающие за пределы трех средних квадратичных отклонений, скорее всего, являются аномальными.

Сравнение групп данных по среднему квадратичному отклонению

С помощью среднего квадратичного отклонения можно количественно сравнивать различные совокупности данных между собой. Группа с меньшим значением σ считается менее вариативной, а значения в ней более однородными и предсказуемыми.

Например, можно сравнить σ уровня продаж в разных регионах, стабильность показателей у разных поставщиков, волатильность цен акций различных компаний и так далее.

Стандартизация данных

Для удобства сравнения данных с разным масштабом значений можно воспользоваться стандартизацией - приведением к единому масштабу путем деления отклонения каждого значения от среднего на величину σ.

Стандартизованные значения будут измеряться в единицах "сигма" и иметь среднее 0 и среднее квадратичное отклонение равное 1. Это позволяет корректно сопоставлять данные из разных выборок.

Использование среднего квадратичного отклонения в задачах прогнозирования

Одно из важных применений среднего квадратичного отклонения - это прогнозирование будущих значений временного ряда. Зная σ прошлых наблюдений, можно построить доверительный интервал для прогноза.

Например, если по данным за прошлый год среднее квадратичное отклонение прибыли составило 10 млн рублей, то с вероятностью 95% прибыль в следующем квартале будет находиться в пределах [M ± 2σ], то есть отклоняться от среднего не более чем на 2 отклонения.

Сезонность и тренды

Однако временные ряды часто демонстрируют сезонность, тренды и другие особенности. В таких случаях вместо обычного среднего квадратичного отклонения лучше использовать его модификации:

  • Скользящее среднее квадратичное отклонение
  • Взвешенное среднее квадратичное отклонение
  • Экспоненциально сглаженное среднее квадратичное отклонение

Они позволяют точнее описывать локальные колебания волатильности в ряду.

Выявление аномалий по среднему квадратичному отклонению

Большое отклонение наблюдаемого значения от среднего по сравнению с обычным средним квадратичным отклонением может свидетельствовать об аномалии или выбросе данных.

Для этого вычисляют Z-score - стандартизованную величину отклонения конкретного наблюдения:

Где x - текущее наблюдение, M(X) - среднее по выборке, σ - среднее квадратичное отклонение.

Если |Z| > 3 - скорее всего, имеет место выброс. Если |Z| > 2 - то наблюдение находится достаточно далеко от центра распределения, чтобы считать его аномальным.

Комментарии