Дисперсия - один из ключевых статистических показателей, характеризующих разброс значений в наборе данных. Но как ее посчитать на практике, если под рукой нет готовых функций в Excel? Давайте разберемся!
Что такое дисперсия и зачем она нужна
Дисперсия показывает, насколько сильно значения данных отличаются от их среднего. Чем выше дисперсия - тем более разбросаны значения. Например, оценки студентов 3,4,4,4,5 имеют дисперсию 0,3. А оценки 1,2,4,9 - уже 5,7. Во втором случае разброс сильнее.
Знание дисперсии позволяет понять, насколько данные однородны. Это важно при анализе результатов экспериментов, показателей бизнеса, социологических опросов и во многих других областях.
Как посчитать дисперсию вручную по определению
Дисперсия вычисляется по формуле:
Где xi - отдельные значения данных, x- - их среднее арифметическое, а N - количество значений.
Например, посчитаем дисперсию ряда 2, 3, 6, 7, 10. Сначала найдем среднее: (2 + 3 + 6 + 7 + 10) / 5 = 5.6. Затем для каждого числа посчитаем отклонение от среднего, возведем его в квадрат и сложим:
- 2: (2 - 5.6)2 = 12.96
- 3: (3 - 5.6)2 = 7.84
- 6: (6 - 5.6)2 = 0.16
- 7: (7 - 5.6)2 = 1.96
- 10: (10 - 5.6)2 = 20.16
Сумма квадратов отклонений = 12.96 + 7.84 + 0.16 + 1.96 + 20.16 = 43.08. Делим сумму на количество значений 5. Получаем дисперсию = 43.08 / 5 = 8.616.

Расчет дисперсии в Excel
В Excel для автоматизации вычислений есть функция ДИСП:
Рассмотрим пример расчета дисперсии в Excel на числовых данных:
A | B |
2 | =ДИСП(A1:A5) |
3 | 8.616 |
6 | |
7 | |
10 |
Мы ввели исходные данные в столбец A, а в ячейке B1 ввели формулу =ДИСП() с диапазоном A1:A5. Получили тот же результат, что и при ручном подсчете выше.
В Excel удобно сразу видеть дисперсию данных и при их изменении.
Еще один способ - через функции СРЗНАЧ и СТАНДОТКЛОН:
- СРЗНАЧ - для подсчета среднего
- СТАНДОТКЛОН - для стандартного отклонения
- Возводим стандотклонение в квадрат, чтобы получить дисперсию
Как найти дисперсию ряда чисел
Теперь разберем более сложный случай - как посчитать дисперсию интервального ряда в Excel.
Допустим, у нас есть данные о зарплатах сотрудников компании, сгруппированные в интервалы:
Зарплата, руб. | Число сотрудников |
20000-30000 | 12 |
30001-40000 | 18 |
40001-50000 | 7 |
50001-60000 | 3 |
Для расчета дисперсии такого ряда нам понадобится:
- Найти среднюю зарплату всего персонала
- Для каждого интервала вычислить отклонение его середины от общей средней зарплаты
- Умножить квадрат отклонения на число сотрудников в интервале
- Сложить эти произведения
- Поделить сумму на общее число сотрудников

Пошаговый расчет дисперсии интервального ряда
Давайте пошагово рассчитаем дисперсию зарплат из примера выше.
- Средняя зарплата = (25000*12 + 35000*18 + 45000*7 + 55000*3) / (12 + 18 + 7 + 3) = 38462 руб.
- Отклонение середины 1-го интервала (25000) от средней (38462) составляет -13462. Возводим в квадрат: 134622 = 181296644
- Умножаем квадрат отклонения на число сотрудников в интервале (12): 181296644 * 12 = 2175559728
- Аналогично для остальных интервалов:
- 35000: (35000 - 38462)2 * 18 = 649023104
- 45000: (45000 - 38462)2 * 7 = 241934464
- 55000: (55000 - 38462)2 * 3 = 102061444
- Складываем значения: 2175559728 + 649023104 + 241934464 + 102061444 = 419417840
- Делим сумму на общее число сотрудников: 419417840 / (12 + 18 + 7 + 3) = 419417840 / 40 = 10485440
Итого, дисперсия зарплат сотрудников равна 10485440.
Как найти дисперсию с разными весами
Если у нас есть веса или частоты при каждом наблюдении, тоже можно найти дисперсию. Нужно скорректировать формулу и везде учитывать веса.
Например, есть оценки студентов за проекты с указанием числа таких оценок:
Оценка за проект | Число таких оценок |
5 | 15 |
4 | 12 |
3 | 5 |
Тогда формула дисперсии примет вид:
Где wi - веса наблюдений.
Как найти размах дисперсии значений
Чтобы найти размах, на который в среднем отклоняются значения от средней, нужно вычислить квадратный корень из дисперсии. Это и есть стандартное отклонение σ.
Например, если ранее мы посчитали дисперсию зарплат 10485440, то их стандартное отклонение будет √10485440 = 3236 рублей.
Это означает, что значения зарплат в среднем отклоняются от средней 38462 рубля на 3236 рублей в обе стороны. То есть попадают в диапазон от 38462 - 3236 = 35226 рублей, до 38462 + 3236 = 41698 рублей.
Программы для расчета дисперсии
Кроме Excel, можно рассчитать дисперсию онлайн или используя статистические пакеты - MATLAB, RapidMiner, Statistica, SPSS и другие.
Универсальный калькулятор позволяет найти дисперсию числовых рядов и посмотреть график распределения:
Он учитывает числовые веса данных и может выдать готовую формулу для Excel.
В MATLAB реализована функция var() для расчета дисперсии массива данных.
А в языке Python можно использовать numpy, scipy, pandas и другие библиотеки для статистического анализа и вычисления дисперсии.