Как найти дисперсию ряда чисел: пошаговая инструкция с примерами

Дисперсия - один из ключевых статистических показателей, характеризующих разброс значений в наборе данных. Но как ее посчитать на практике, если под рукой нет готовых функций в Excel? Давайте разберемся!

Что такое дисперсия и зачем она нужна

Дисперсия показывает, насколько сильно значения данных отличаются от их среднего. Чем выше дисперсия - тем более разбросаны значения. Например, оценки студентов 3,4,4,4,5 имеют дисперсию 0,3. А оценки 1,2,4,9 - уже 5,7. Во втором случае разброс сильнее.

Знание дисперсии позволяет понять, насколько данные однородны. Это важно при анализе результатов экспериментов, показателей бизнеса, социологических опросов и во многих других областях.

Как посчитать дисперсию вручную по определению

Дисперсия вычисляется по формуле:

Где xi - отдельные значения данных, x- - их среднее арифметическое, а N - количество значений.

Например, посчитаем дисперсию ряда 2, 3, 6, 7, 10. Сначала найдем среднее: (2 + 3 + 6 + 7 + 10) / 5 = 5.6. Затем для каждого числа посчитаем отклонение от среднего, возведем его в квадрат и сложим:

  • 2: (2 - 5.6)2 = 12.96
  • 3: (3 - 5.6)2 = 7.84
  • 6: (6 - 5.6)2 = 0.16
  • 7: (7 - 5.6)2 = 1.96
  • 10: (10 - 5.6)2 = 20.16

Сумма квадратов отклонений = 12.96 + 7.84 + 0.16 + 1.96 + 20.16 = 43.08. Делим сумму на количество значений 5. Получаем дисперсию = 43.08 / 5 = 8.616.

Расчет дисперсии вручную на бумаге

Расчет дисперсии в Excel

В Excel для автоматизации вычислений есть функция ДИСП:

Рассмотрим пример расчета дисперсии в Excel на числовых данных:

A B
2 =ДИСП(A1:A5)
3 8.616
6
7
10

Мы ввели исходные данные в столбец A, а в ячейке B1 ввели формулу =ДИСП() с диапазоном A1:A5. Получили тот же результат, что и при ручном подсчете выше.

В Excel удобно сразу видеть дисперсию данных и при их изменении.

Еще один способ - через функции СРЗНАЧ и СТАНДОТКЛОН:

  1. СРЗНАЧ - для подсчета среднего
  2. СТАНДОТКЛОН - для стандартного отклонения
  3. Возводим стандотклонение в квадрат, чтобы получить дисперсию

Как найти дисперсию ряда чисел

Теперь разберем более сложный случай - как посчитать дисперсию интервального ряда в Excel.

Допустим, у нас есть данные о зарплатах сотрудников компании, сгруппированные в интервалы:

Зарплата, руб. Число сотрудников
20000-30000 12
30001-40000 18
40001-50000 7
50001-60000 3

Для расчета дисперсии такого ряда нам понадобится:

  1. Найти среднюю зарплату всего персонала
  2. Для каждого интервала вычислить отклонение его середины от общей средней зарплаты
  3. Умножить квадрат отклонения на число сотрудников в интервале
  4. Сложить эти произведения
  5. Поделить сумму на общее число сотрудников
Женщина считает дисперсию в Excel

Пошаговый расчет дисперсии интервального ряда

Давайте пошагово рассчитаем дисперсию зарплат из примера выше.

  1. Средняя зарплата = (25000*12 + 35000*18 + 45000*7 + 55000*3) / (12 + 18 + 7 + 3) = 38462 руб.
  2. Отклонение середины 1-го интервала (25000) от средней (38462) составляет -13462. Возводим в квадрат: 134622 = 181296644
  3. Умножаем квадрат отклонения на число сотрудников в интервале (12): 181296644 * 12 = 2175559728
  4. Аналогично для остальных интервалов:
  • 35000: (35000 - 38462)2 * 18 = 649023104
  • 45000: (45000 - 38462)2 * 7 = 241934464
  • 55000: (55000 - 38462)2 * 3 = 102061444
  1. Складываем значения: 2175559728 + 649023104 + 241934464 + 102061444 = 419417840
  2. Делим сумму на общее число сотрудников: 419417840 / (12 + 18 + 7 + 3) = 419417840 / 40 = 10485440

Итого, дисперсия зарплат сотрудников равна 10485440.

Как найти дисперсию с разными весами

Если у нас есть веса или частоты при каждом наблюдении, тоже можно найти дисперсию. Нужно скорректировать формулу и везде учитывать веса.

Например, есть оценки студентов за проекты с указанием числа таких оценок:

Оценка за проект Число таких оценок
5 15
4 12
3 5

Тогда формула дисперсии примет вид:

Где wi - веса наблюдений.

Как найти размах дисперсии значений

Чтобы найти размах, на который в среднем отклоняются значения от средней, нужно вычислить квадратный корень из дисперсии. Это и есть стандартное отклонение σ.

Например, если ранее мы посчитали дисперсию зарплат 10485440, то их стандартное отклонение будет √10485440 = 3236 рублей.

Это означает, что значения зарплат в среднем отклоняются от средней 38462 рубля на 3236 рублей в обе стороны. То есть попадают в диапазон от 38462 - 3236 = 35226 рублей, до 38462 + 3236 = 41698 рублей.

Программы для расчета дисперсии

Кроме Excel, можно рассчитать дисперсию онлайн или используя статистические пакеты - MATLAB, RapidMiner, Statistica, SPSS и другие.

Универсальный калькулятор позволяет найти дисперсию числовых рядов и посмотреть график распределения:

Он учитывает числовые веса данных и может выдать готовую формулу для Excel.

В MATLAB реализована функция var() для расчета дисперсии массива данных.

А в языке Python можно использовать numpy, scipy, pandas и другие библиотеки для статистического анализа и вычисления дисперсии.

Статья закончилась. Вопросы остались?
Комментарии 0
Подписаться
Я хочу получать
Правила публикации
Редактирование комментария возможно в течении пяти минут после его создания, либо до момента появления ответа на данный комментарий.