Вступление. Относительная частота - важная статистическая характеристика данных, позволяющая сравнивать группы и анализировать структуру выборки. В статье подробно рассматриваются теоретические основы понятия, практические примеры расчета в различных ситуациях и особенности интерпретации полученных результатов.
Определение относительной частоты
Относительная частота - это доля элементов выборки, обладающих некоторым свойством, по отношению к общему количеству элементов. Формально это отношение числа элементов с заданным свойством к общему числу элементов выборки:
fотн = nсв / N
где fотн - относительная частота, nсв - число элементов с данным свойством, N - общее число элементов.
Например, если из 100 опрошенных 25 ответили "да", то относительная частота положительных ответов равна 25/100 = 0,25.

Области применения
Относительная частота широко используется в различных областях:
- Статистика и анализ данных
- Социологические и маркетинговые исследования
- Медицинская статистика
- Финансовый и экономический анализ
- Страхование
Рассмотрим некоторые типичные примеры.
Примеры расчета относительной частоты

Социологическое исследование
В ходе опроса 1000 респондентов на вопрос "Смотрите ли вы спортивные передачи по ТВ?" получены следующие ответы:
Да | 487 |
Нет | 513 |
Требуется найти относительную частоту положительных и отрицательных ответов. Решение:
fотн да = 487 / 1000 = 0,487 (48,7%)
fотн нет = 513 / 1000 = 0,513 (51,3%)
Анализ успеваемости в школе
В классе 30 учеников. Из них 18 получили за четверть оценки "4" и "5". Найдем относительную частоту хорошистов:
fотн = 18 / 30 = 0,6 (60%)
Медицинская статистика
Из 350 пациентов с подозрением на COVID-19 положительный результат ПЦР-теста получен у 198 человек. Вычислим относительную частоту положительных результатов:
fотн = 198 / 350 = 0,566 (56,6%)
Как найти относительную частоту
Алгоритм расчета относительной частоты состоит из следующих шагов:
- Подсчитать число элементов выборки с интересующим нас свойством (означим через nсв).
- Определить общее число элементов выборки (N).
- Разделить число элементов с заданным свойством на общее число элементов.
- Преобразовать полученную долю в проценты (умножив на 100).
Рассмотрим на примере. В выборке из 25 человек 7 являются курильщиками. Требуется найти долю курильщиков.
- Число курящих: nсв = 7
- Общее число человек: N = 25
- Относительная частота: fотн = 7 / 25 = 0,28
- В процентах: 0,28 * 100 = 28%
Итак, доля курильщиков в выборке составляет 28%.
Как найти относительную частоту
Еще один способ вычисления относительной частоты - с помощью построения таблицы частот. Рассмотрим числовой пример.
Имеются данные о количестве детей в семьях 25 респондентов:
Число детей | 0 | 1 | 2 | 3 и более |
Абс. частота | 5 | 9 | 7 | 4 |
Построим таблицу частот с относительными частотами:
Число детей | Абс. частота (fi) | Отн. частота (fi/N) |
0 | 5 | 5/25 = 0,2 |
1 | 9 | 9/25 = 0,36 |
2 | 7 | 7/25 = 0,28 |
3 и более | 4 | 4/25 = 0,16 |
Как видим, относительная частота находится простым делением абсолютной частоты на общее число наблюдений.
Особенности интерпретации
При анализе относительной частоты следует обращать внимание на ряд моментов:
-
Относительная частота зависит от структуры выборки. Например, в группе пенсионеров доля людей с хроническими заболеваниями будет выше, чем в общей популяции.
-
Сравнивать относительные частоты имеет смысл только для однотипных выборок. При сравнении групп с различной структурой результаты могут быть искажены.
-
Относительная частота несет меньше информации, чем исходные данные. Например, увеличение продаж на 5% может соответствовать как небольшому абсолютному приросту в несколько единиц, так и крупной сделке на миллионы долларов.
Таким образом, корректная интерпретация относительной частоты требует комплексного подхода с учетом особенностей анализируемых данных.
Относительная частота - одна из ключевых статистических характеристик, широко используемая в задачах анализа данных, социологии, медицине, экономике. Ее расчет не представляет сложности, но для правильной интерпретации требуется учитывать структуру выборки и другие факторы.
Дополнительные аспекты расчета
Помимо описанных выше базовых методов, существует несколько дополнительных аспектов, которые следует учитывать при расчете относительной частоты в реальных задачах.
Учет весов наблюдений
Иногда одни наблюдения должны учитываться с большим "весом", чем другие. Например, при анализе рынка компания может присваивать больший вес крупным или лояльным клиентам. В этом случае формула принимает вид:
fотн = (w1·n1 + ... + wk·nk) / (w1·N1 + ... + wk·Nk)
где wi - вес i-й группы наблюдений, а ni и Ni - число наблюдений в этой группе с данным свойством и общее.
Доверительные интервалы
Точечные оценки относительной частоты имеют случайную ошибку. Чтобы оценить точность, рассчитывают доверительный интервал. Например, для 95%-го доверительного интервала:
(fотн - e, fотн + e)
Где e - предельная ошибка выборки, зависящая от объема данных и величины доверительной вероятности.
Расчет относительной частоты в ПО
Большинство систем обработки данных, таких как Microsoft Excel, Statistica, SPSS, MATLAB, Python и R, имеют встроенные функции для расчета относительной частоты. Рассмотрим примеры.
В Excel
Для подсчета используется комбинация стандартных функций:
- СЧЕТЕСЛИ - подсчет элементов с заданным условием
- СЧЕТ - подсчет всех элементов
- ДЕЛИТЬ - вычисление частного
Формула для ячейки с относительной частотой:
=ДЕЛИТЬ(СЧЕТЕСЛИ(диапазон;условие);СЧЕТ(диапазон))
В статпакетах и языках программирования
Здесь для подсчета относительной частоты используются специальные методы, такие как value_counts()
в Pandas или prop.table()
в R. Это позволяет автоматически рассчитывать частоты для всех категорий данных.
Применение относительной частоты на практике
Далее рассмотрим примеры применения относительной частоты для решения реальных задач.
Анализ кредитных рисков
Банки рассчитывают относительную частоту дефолтов по кредитам с различными характеристиками. Это позволяет оценить вероятность невозврата для новых заемщиков.
Оптимизация маркетинговых кампаний
Для повышения эффективности таргетированной рекламы анализируют относительную частоту конверсий в разрезе пола, возраста, интересов целевой аудитории.
Оценка удовлетворенности клиентов
Компании регулярно анализируют относительную частоту положительных, нейтральных и отрицательных отзывов о продуктах и сервисах.