U-критерий Манна-Уитни: таблица и алгоритм расчета

U-критерий Манна-Уитни является непараметрическим статистическим критерием, который позволяет оценить различия между двумя независимыми выборками по уровню какого-либо количественного признака. Этот критерий основан на ранжировании и сравнении сумм рангов в выборках. Он хорошо подходит для анализа данных в случаях, когда распределение признака в генеральной совокупности отличается от нормального или имеются выбросы.

Преимуществом критерия У Манна-Уитни является то, что он более мощный, чем критерий Розенбаума, и позволяет обнаруживать различия даже при небольшом объеме выборок.

Условия применения

Критерий Манна-Уитни применяется для сравнения двух независимых выборок по уровню количественного признака. Он позволяет оценить, есть ли статистически значимые различия между выборками или наблюдаемые различия случайны. Критерий основан на ранжировании всех значений обеих выборок и подсчете суммы рангов в каждой группе.

  • Допускается применение критерия при объеме выборок: n1 ≥ 3, n2 ≥ 3, либо n1 = 2, n2 ≥ 5
  • Для каждой выборки объем должен быть не более 60 наблюдений: n1 ≤ 60, n2 ≤ 60
  • Признак, по которому сравниваются выборки, должен быть количественным и измеренным в интервальной или отношенной шкале

У-критерий Манна-Уитни применим для сравнения небольших выборок и позволяет выявить различия между ними даже в тех случаях, когда применение параметрических критериев (например, критерия Стьюдента) невозможно из-за нарушения условий нормальности или однородности дисперсий.

К недостаткам критерия можно отнести снижение его чувствительности при больших объемах выборок (n > 20) и довольно громоздкие вычисления, требующие ранжирования. Поэтому в этих случаях чаще применяют непараметрические аналоги дисперсионного анализа, такие как критерий Краскела-Уоллиса.

U-критерий Манна-Уитни: таблица и алгоритм расчета

Для применения критерия Манна-Уитни используется следующий алгоритм:

  1. Переносим все данные обеих выборок (значения измеренного количественного признака для каждого испытуемого) на отдельные карточки или в таблицу. Обозначаем карточки первой и второй выборки разными цветами.
  2. Объединяем значения из обеих выборок в один общий ряд, не различая принадлежности к той или иной выборке. Сортируем полученный ряд по возрастанию.
  3. Проводим ранжирование всех значений: наименьшему присваиваем 1-й ранг, следующему по возрастанию - 2-й ранг и т.д. При наличии одинаковых значений присваиваем им средний ранг.
  4. Разделяем полученные ранжированные значения обратно на две выборки, ориентируясь на цветные метки. Подсчитываем сумму рангов отдельно для каждой выборки.
  5. Определяем, какая из двух сумм рангов больше. Обозначим ее как T1, а меньшую сумму - как T2. Подставляем суммы рангов в формулу для расчета U:
U = n1•n2 + (n1•(n1+1))/2 - T1
  1. Сравниваем полученное значение Уэмп с критическим Укрит по специальной таблице критических значений. Если Уэмп меньше Укрит, различия между выборками статистически значимы с заданным уровнем значимости (чаще 0.05).

Таков пошаговый алгоритм расчета критерия Манна-Уитни. Ключевым моментом является ранжирование исходных значений и последующее вычисление суммы рангов в каждой выборке для сравнения. Чем меньше зона перекрытия рангов в сравниваемых выборках, тем более вероятно наличие статистически значимых различий.

Интерпретация результатов

При интерпретации результатов критерия Манна-Уитни в первую очередь анализируют полученное эмпирическое значение Уэмп и сравнивают его с критическим значением Укрит, определенным по специальной таблице.

Если Уэмп меньше или равно Укрит, то нулевая гипотеза об отсутствии различий между выборками отвергается, а альтернативная гипотеза о наличии таких различий принимается с заданным уровнем значимости (чаще 0.05 или 0.01).

Чем меньше фактическое значение Уэмп, тем больше выражены различия между выборками. То есть при прочих равных условиях меньшие значения Уэмп соответствуют более высокому уровню статистической значимости.

Если же Уэмп больше Укрит, то нулевая гипотеза принимается, а различия между выборками по изучаемому признаку считаются статистически незначимыми.

Кроме того, при интерпретации обращают внимание на соотношение сумм рангов в сравниваемых выборках. Более высокая сумма рангов указывает на тенденцию преобладания значений измеряемого количественного признака в соответствующей выборке.

Критерий Манна-Уитни позволяет не только выявить наличие или отсутствие статистически значимых различий между двумя выборками, но и определить направление этих различий посредством анализа сумм рангов в каждой группе.

Преимущества и недостатки

Критерий Манна-Уитни обладает рядом преимуществ по сравнению с другими статистическими критериями:

  • Применим для малых выборок, когда объем каждой группы от 3 до 60 наблюдений;
  • Не требует соблюдения допущений о нормальности распределения и равенстве дисперсий, то есть относится к непараметрическим критериям;
  • Устойчив к выбросам и экстремальным значениям благодаря использованию рангов вместо самих значений признака;
  • Позволяет определить не только значимость, но и направление различий между выборками посредством сравнения сумм рангов.

Однако критерий Манна-Уитни не лишен и определенных недостатков:

  • Сложный ручной подсчет, включающий ранжирование всех значений обеих выборок;
  • Уменьшение мощности критерия при больших объемах выборок;
  • Зависимость результата от распределения значений измеряемого признака.

Несмотря на перечисленные недостатки, критерий Манна-Уитни остается одним из наиболее часто используемых непараметрических критериев для оценки различий между двумя выборками по уровню количественного признака.

Сравнение с другими критериями

Критерий Манна-Уитни часто сравнивают с другим популярным непараметрическим критерием - U-критерием Уилкоксона. Оба критерия основаны на ранжировании, подсчете суммы рангов и сравнении с критическими значениями. Однако есть несколько отличий:

  • Критерий Уилкоксона используется для зависимых или парных выборок, когда одна и та же группа испытуемых оценивается дважды, до и после воздействия. А критерий Манна-Уитни применим только для независимых выборок;
  • У критерия Уилкоксона более простой алгоритм расчета, так как ранжированию подвергается лишь разность значений в парных измерениях;
  • Критерий Манна-Уитни считается несколько более мощным и чувствительным при одинаковых объемах выборок.

Также критерий Манна-Уитни иногда сравнивают с t-критерием Стьюдента для независимых выборок. На практике их применение во многом схоже. Однако между ними есть принципиальное отличие:

Критерий Стьюдента относится к параметрическим, а критерий Манна-Уитни - к непараметрическим. Первый требует обязательной проверки допущений о нормальности распределения и равенстве дисперсий. А второй не предъявляет таких жестких условий и применим даже при отклонении от нормальности.

Именно большая устойчивость к нарушениям допущений делает критерий Манна-Уитни особенно полезным для анализа малых выборок, где обеспечение нормального распределения данных затруднено.

Пример расчета в SPSS

Рассмотрим пример использования критерия Манна-Уитни для сравнения двух независимых выборок в пакете IBM SPSS Statistics.

Допустим, имеются данные о результатах тестирования на интеллект у двух групп старшеклассников: гуманитарного класса (30 человек) и физико-математического (25 человек). Необходимо определить, есть ли между классами статистически значимые различия по уровню интеллекта.

Последовательность действий в SPSS:

  1. Указываем переменную со значениями количественного признака (результаты теста на интеллект) - «Intellect»;
  2. Выбираем в меню: «Анализ - Непараметрические критерии - 2 независимые выборки»;
  3. В появившемся окне переносим название переменной «Intellect» в поле «Переменная тестирования»;
  4. В качестве группирующей переменной указываем принадлежность к классу: «Class» с двумя значениями («гуманитарный» и «физмат»);
  5. В поле статистического критерия выбираем: «Манна-Уитни U».
  6. Запускаем выполнение процедуры нажатием ОК.

В выходной таблице результатов будут представлены суммы рангов для каждой группы, значения U и уровень значимости p. Сравнивая p с 0,05 можно сделать вывод о наличии значимых различий по интеллекту между классами.

Комментарии