Статистические функции в Excel: перечень, применение
Описательная статистика является фундаментом анализа данных. С ее помощью мы можем получить общее представление о наборе значений, не вдаваясь в детали. Рассмотрим основные функции Excel, которые используются в описательной статистике.
Наиболее часто применяются следующие функции:
- СРЗНАЧ - вычисляет среднее арифметическое;
- МАКС и МИН - находят наибольшее и наименьшее значения;
- МЕДИАНА - вычисляет медиану (середину упорядоченного ряда);
- МОДА - находит моду (наиболее часто встречающееся значение).
Например, чтобы найти самую высокую и самую низкую цену товара используем:
=МАКС(B2:B10)
=МИН(B2:B10)
Измерение вариации данных
Помимо среднего значения, важно знать, насколько сильно отдельные значения отличаются от среднего. Для этого используются функции СТАНДОТКЛОН
и ДИСП
.
СТАНДОТКЛОН
вычисляет стандартное отклонение - наиболее распространенную меру разброса значений. Чем оно выше, тем сильнее различаются значения выборки.
Функция ДИСП
возвращает дисперсию - квадрат стандартного отклонения. Интерпретируется аналогично.
Ранжирование данных
Для упорядочивания значений по величине используются функции НАИБОЛЬШИЙ
и НАИМЕНЬШИЙ
.
Например, чтобы найти третий по величине элемент, применяем:
=НАИБОЛЬШИЙ(A1:A10;3)
А для поиска второго наименьшего:
=НАИМЕНЬШИЙ(A1:A10;2)
Перцентильный анализ
Перцентиль показывает значение, ниже которого находится заданный процент элементов выборки.
Например, 25-й перцентиль - это значение, меньше которого 25% всех данных.
В Excel перцентили вычисляются с помощью функции КВАРТИЛЬ
.
Частотный анализ данных
Частотный анализ позволяет оценить, как часто встречаются определéнные значения в выборке.
Для этого строятся гистограммы - графическое представление распределения частот.
В Excel гистограммы строятся с помощью диаграммы Гистограмма.
Построение гистограммы
Для построения гистограммы в Excel необходимо:
- Отсортировать исходные данные по возрастанию;
- Определить интервалы групп и подсчитать частоту попадания значений в каждый интервал;
- Построить столбчатую диаграмму по полученным данным.
Рассмотрим на примере. Допустим, у нас есть ряд значений выручки магазина по дням недели:
Сгруппируем значения с шагом 10 000 рублей и подсчитаем частоту попадания:
Интервалы | 10 000-20 000 | 20 000-30 000 | 30 000-40 000 |
Частота | 2 | 3 | 1 |
Теперь построим гистограмму выручки:
Нормальное распределение
В статистике часто рассматривается нормальное (гауссово) распределение. Оно имеет колоколообразную плотность вероятности с единственным максимумом.
В Excel функция СЛЧИСНОРМ
позволяет генерировать нормально распределенные случайные числа. Это удобно для статистического моделирования.
Линейная регрессия
Линейная регрессия ищет прямую линию, наилучшим образом приближающую набор точек. Она характеризует силу и направление связи между двумя переменными.
Для построения используется функция ЛИНЕЙН
. Она возвращает коэффициенты уравнения регрессии y = kx + b.
Корреляционный анализ
Корреляционный анализ изучает тесноту связи между двумя переменными. Его мерой служит коэффициент корреляции, рассчитываемый в Excel с помощью функции КОРРЕЛ
.
Он принимает значения от -1 (сильная обратная зависимость) до +1 (сильная прямая зависимость).
Интерпретация корреляции
При анализе результатов корреляционного анализа важно правильно интерпретировать полученное значение коэффициента.
- 0-0.3 - слабая корреляция;
- 0.3-0.7 - умеренная;
- 0.7-1 - сильная.
Кроме того, следует понимать, что корреляция не обязательно означает наличие причинно-следственной связи между показателями. Здесь необходим дополнительный анализ.
Проверка статистических гипотез
Для проверки гипотез о равенстве средних или дисперсий двух выборок используются статистические критерии.
В Excel это реализовано функциями T.ОБР.2Х
(критерий Стьюдента) и F.ОБР.2Х
(критерий Фишера).
Они позволяют проверить нулевую гипотезу и сделать вывод о ее подтверждении или опровержении для заданного уровня значимости.
Доверительные интервалы
Доверительные интервалы дают представление о точности оценки параметров распределения, например среднего значения.
С заданной доверительной вероятностью (например 95%) истинное среднее значение попадает в вычисленный интервал.
В Excel для расчета используется функция ДОВЕРИТ
.
Мастер статистических функций
Для удобства работы со статистическими функциями Excel существует специальный Мастер функций. Он помогает выбрать нужную функцию и корректно задать аргументы.
Чтобы воспользоваться Мастером функций для работы со статистическими формулами, выполните следующие действия:
- Перейдите на вкладку "Формулы";
- В группе "Библиотека функций" нажмите кнопку "Вставить функцию";
- В окне Мастера выберите категорию "Статистические";
- Из списка функций выберите нужную.
Например, чтобы найти среднее значение с помощью СРЗНАЧ
, выполните:
Задание аргументов
После выбора функции, Мастер предложит указать необходимые аргументы.
Для СРЗНАЧ
нужно задать диапазон значений, по которым будет найдено среднее арифметическое.
Мастер подскажет, какие данные требуются для конкретной функции, поможет задать нужный формат и избежать ошибок.
Завершение работы
После указания аргументов нажмите "ОК" - Мастер вставит готовую формулу со скобками и нужными ссылками на ячейки.
Теперь вы можете при необходимости отредактировать формулу вручную.
Таким образом, Мастер функций значительно упрощает использование статистических формул Excel в работе с данными.
Автоматизация расчетов
Ручной ввод множества статистических формул может быть утомительным. В Excel предусмотрены средства для автоматизации.
С помощью форм данных можно быстро выполнить описательные статистические расчеты для выбранного столбца или строки.
Достаточно нажать "Форма", выбрать параметры и получить результаты за один шаг.
Пакетный анализ
Если нужно вычислить одни и те же характеристики для множества наборов данных на листе, можно воспользоваться Пакетным анализом.
Он применит указанную пользователем функцию к заданным столбцам или строкам, заполнив результатами сводную таблицу.
Визуализация данных
Помимо расчетных функций, важно грамотно визуализировать полученную статистическую информацию.
Для этих целей в Excel предусмотрены различные типы диаграмм и графические средства анализа.
Это позволяет легко интерпретировать результаты и принимать обоснованные решения.
Визуализация распределения
Чтобы наглядно представить распределение значений в выборке, удобно использовать гистограммы.
В Excel для их построения предназначен специальный тип диаграмм - Гистограмма. Чтобы ее создать:
- Выделите исходные данные с частотами;
- Перейдите на вкладку "Вставка";
- Выберите тип "Гистограмма".
Также полезными для анализа распределения являются диаграммы рассеивания и Pivot-диаграммы.
Визуализация динамики
Для отображения динамики показателя по периодам времени подходят графики.
В Excel удобно использовать тип диаграмм - График. Чтобы его построить:
- Выделите исходные данные со значениями за периоды;
- Выберите тип графика - График.
Получится наглядно увидеть рост, падение, тренды показателя.
Интерактивный анализ
Для более глубокого анализа данных используйте средство "Срез данных".
Оно позволяет динамически фильтровать данные на графике и в таблицах при выборе элементов. Так можно быстро анализировать влияние разных факторов, причинно-следственные связи.