Повна версія

Головна arrow Психологія arrow Експериментальна психологія

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

Проблеми, які щоразу потрібно вирішувати заново

Проблеми статистичного оцінювання як тестування нуль-гіпотез

Перевірка статистичних гіпотез є стандартом в аналізі психологічних даних з погляду їх надійності та оцінки впевненості в їх достовірності. Це найпоширеніший спосіб кількісної оцінки результатів досліджень. Вище, в главі 6 була представлена логіка оцінювання статистичних гіпотез в традиціях старого (фішеровським) і нового (нейманпірсоновского) підходів.

Перевірка статистичних гіпотез найчастіше визначається як статистичний метод, який використовує вибіркові дані для формалізованої оцінки гіпотез про популяції. Описана в главі 6 традиція прийняття чи неприйняття ЕГ на основі оцінювання значущості відкидання нуль-гіпотези - ПЗНГ - заснована на роботах Р. Фішера. Не вдаючись у подробиці історії розвитку ПЗНГ, зупинимося на тому, якою ця процедура, популяризована в 50-х рр. XX ст., Бачиться провідним фахівцям в галузі методології соціальних наук і статистики в даний час.

ПЗНГ має безліч прихильників і лютих критиків, атакуючих цей метод практично з самого його появи. Особлива увага до ПЗНГ, зокрема, пов'язано з інституціоналізацією ПЗНГ як ключового розділу інференціальной статистики у викладанні психології в зарубіжних університетах [Friedrich et al., 2000]. Критика ПЗНГ в найбільш загальному вигляді пов'язана з трьома проблемами: 1) рутинним і помилковим застосуванням ПЗНГ у більшості досліджень, 2) неадекватністю ПЗНГ стосовно цілям і завданням досліджень і 3) неправильною інтерпретацією результатів ПЗНГ.

Г. Гігеренцер, обговорюючи ПЗНГ, зазначає, що ПЗНГ стала не адекватною статистичної процедурою, але бездумним дослідним ритуалом [Gigerenzer, 20031, при якій дослідник формулює Я (| як гіпотезу про "нульові відмінностях" або "нульових кореляціях», не формулюючи ні чіткі передбачення дослідницької гіпотези, ні власне альтернативну гіпотезу Я ,. В якості критичного рівня значущості вибирається а = .05, при цьому якщо отримане в дослідженні р <а, дослідник приймає Яр а результати представляє у вигляді р <.05, <.01, < .001 і т.д. залежно від того, до якої точки ближче точне значення р. Таке використання ПЗНГ фактично означає змішання двох традицій, а саме: традиції, заснованої на ранніх роботах Р. Фішера, і традиції, заснованої на роботах Дж. Неймана і Е. Пірсона (див. табл. 6.1).

Механічне використання ПЗНГв сукупності з помилками про теорію статистичного висновку, недостатнім рівнем статистичної грамотності і інерційністю психологічного співтовариства призвело до закріплення не тільки традиції ПЗНГ, але і помилкових уявлень про сутність інформації, яку вона надає. Ми коротко узагальнили основні помилки в інтерпретації результатів ПЗНГ, представлені в огляді Р. Клайна [Kline, 2004], в табл. 8.2. Не зупиняючись детально на кожній з них, відзначимо кілька важливих, на наш погляд, загальних помилок, які стали предметом особливо лютою критики з боку супротивників ПЗНГ.

Одна з основних помилок полягає в інтерпретації величини отриманого рівня значущості р як відбиває ймовірність отримання зазначених результатів через вплив випадкових факторів та / або ймовірність істинності Яц. Обидві інтерпретації невірні і відображають істотні обмеження процедури ПЗНГ. У першому випадку важливо розуміти, що в будь-якому дослідженні вказаний статистичний критерій буде приймати значення, відмінне від "ідеального", за умови істинності Я0іменно в силу впливу випадкових факторів. ПЗНГ спрямована на встановлення відмінностей між вибірковим значенням критерію і його теоретичним розподілом за умови істинності Я0 і при обліку "випадкових" чинників. Друга помилка пов'язана з бажанням інтерпретувати р в контексті того, що якраз і цікавить дослідника, а саме: ймовірності, пов'язаної з істинністю нуль-гіпотези, р (Н0П). На жаль, ПЗНГ дозволяє встановлювати тільки умовну ймовірність отримання певних даних при істинності Я (), р (ОН0), де О - отримані дані.

Другим істотним обмеженням ПЗНГ є відсутність кількісної інформації про величину спостережуваного ефекту. Частою помилкою є інтерпретація р як показника величини ефекту, що викликано ігноруванням питань взаємозв'язку розміру вибірки, потужності статистичного критерію в даному дослідженні і розміру ефекту. Так, р прямо залежить від величини вибірки і розміру спостережуваного ефекту, тому навіть самий тривіальний ефект буде статистично значущий при достатній кількості піддослідних.

Проблемою є й усталене розуміння # 0 як нуль-гіпотези, формульованій як гіпотеза про відсутність відмінностей (р, - р2 = 0) або нульовому ефекті (г = 0). Найчастіше таке формулювання є необґрунтованою як невраховує: 1) наявність "кореляційного шуму" як наявності ненульових взаємозв'язків між більшістю змінних в психологічних дослідженнях, 2) проблеми клінічної та практичної значущості отриманих результатів. Так, сама по собі ПЗНГ не вимагає формулювання нуль-гіпотези як гіпотези про відсутність відмінностей, навпаки, це може бути гіпотеза про певному розмірі відмінностей (наприклад, про різницю в інтелекті між двома популяціями р, - р2 = 15 балів за шкалою 1 (У ). Легко помітити, що такий підхід дозволяє перевіряти набагато більш точкові гіпотези, в яких відправною точкою є твердження про значення розміру ефекту, який може встановлюватися, зокрема, відповідно до міркуваннями мінімальної практичної значущості.

Така специфікація перевіряється гіпотези пов'язана і з іншою проблемою, а саме: інтерпретацією р як показника "значимості" отриманих дослідником результатів. Насправді р НЕ позначає міру практичної, клінічної чи іншої значущості отриманих результатів, оскільки навіть тривіальні за величиною ефекти можуть бути статистично значущими. Уточнення інших видів "значимості" вимагає кількісної оцінки величини ефекту і його зіставлення з критеріями у зазначеній галузі досліджень і практики.

Таблиця 8.2. Типові помилки в інтерпретації результатів ПЗНГ

Типові помилки в інтерпретації результатів ПЗНГ

 
<<   ЗМІСТ   >>