U-критерій Манна-Уітні
Історія та опис
U-критерій Манна-Уітні (англ. Mann — Whitney U-test) — непараметричний статистичний критерій, який застосовується для порівняння двох незалежних вибірок за рівнем будь-якої ознаки, виміряної якісно або в порядковій шкалі.
Критерій був розроблений Френком Манном і Генрі Уітні в 1947 році. Він дозволяє оцінити, чи є статистично значущі відмінності в розподілах досліджуваних ознак між двома вибірками.
Принципи використання
U-критерій Манна-Уітні оснований на об'єднанні двох вибірок у одну, ранжируванні всіх спостережень за величиною ознаки та підрахунку суми рангів для кожної вибірки.
Гіпотеза про відсутність різниці між вибірками перевіряється за допомогою статистичного тесту, який визначає ймовірність отримання отриманих результатів при справедливості нульової гіпотези.
Область застосування
U-критерій Манна-Уітні використовується, коли неможливо застосовувати параметричні критерії (наприклад, t-критерій Стьюдента), оскільки:
- Розподіл досліджуваної ознаки невідомий або не відповідає нормальному розподілу.
- Вибірки малі (менше 30 спостережень).
- Ознака вимірюється в порядковій, а не в інтервальній шкалі.
Переваги та недоліки
Переваги:
- Простота застосування та інтерпретації.
- Можливість порівняння малих вибірок.
- Незалежність від розподілу вибірок.
Недоліки:
- Менша статистична потужність порівняно з параметричними критеріями при нормальному розподілі.
- Неможливість виявити відмінності в дисперсіях вибірок.
Процедура застосування
- Об'єднайте дві вибірки в одну.
- Ранжуйте всі спостереження за величиною ознаки (присвоюйте рівні значенням однакового розміру).
- Підрахуйте суми рангів для кожної вибірки.
- Розрахуйте статистику критерію U за формулою: U = n1 * n2 – (n1 * (n1 + 1) / 2) – (n2 * (n2 + 1) / 2), де n1 і n2 — розміри вибірок.
- Визначте критичне значення U за допомогою статистичних таблиць для заданого рівня значущості та розмірів вибірок.
- Порівняйте розраховану статистику U з критичним значенням. Якщо U менше або дорівнює критичному значенню, то нульова гіпотеза про відсутність різниці між вибірками відкидається.
Приклад застосування
Припустимо, що ми хочемо порівняти рівень інтелекту двох груп учнів: контрольної та експериментальної. Оцінки учнів представлені в наступних таблицях:
| Контрольна група | Експериментальна група |
|---|---|
| 85 | 72 |
| 92 | 80 |
| 78 | 88 |
| 90 | 83 |
и обчислення:
- Об'єднуємо вибірки: 85, 92, 78, 90, 72, 80, 88, 83.
- Ранжуємо спостереження: 1, 2, 3, 3, 5, 5, 7, 8.
- Сума рангів для контрольної групи: 1 + 2 + 3 + 3 = 9.
- Сума рангів для експериментальної групи: 5 + 5 + 7 + 8 = 25.
- U = 4 * 4 – (4 * 5 / 2) – (4 * 5 / 2) = 8.
- Для рівня значущості 0,05 і розмірів вибірок 4 і 4 критичне значення U становить 5.
Оскільки U (8) більше критичного значення (5), ми не відкидаємо нульову гіпотезу і робимо висновок про відсутність статистично значущої різниці між рівнями інтелекту в двох групах учнів.
U-критерій Манна-Уітні є корисним статистичним інструментом для порівняння двох вибірок, коли не можна використовувати параметричні критерії. Незважаючи на меншу статистичну потужність, ніж у параметричних критеріїв, він простий у застосуванні та інтерпретації, що робить його цінним для аналізу малих вибірок або даних з ненормальним розподілом.
Часті запитання
- Для яких типів даних використовується U-критерій Манна-Уітні?
Порядкові або якісні дані. - Коли використовувати U-критерій замість параметричних критеріїв?
Коли розподіл даних невідомий або ненормальний, або коли вибірки малі. - Як інтерпретувати результат U-критерію Манна-Уітні?
Статистично значуща різниця вказує на відмінності в розподілах досліджуваної ознаки між двома вибірками. - Які альтернативи U-критерію Манна-Уітні?
Критерій Колмогорова-Смірнова та критерій Краскела-Уолліса. - Які припущення лежать в основі U-критерію Манна-Уітні?
Вибірки незалежні, вимірювання порядкові або якісні, відсутність зв'язків між вимірами.