Повна версія

Головна arrow Психологія arrow ЕКСПЕРИМЕНТАЛЬНА ПСИХОЛОГІЯ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

МЕТОДИ СТАТИСТИЧНОЇ ОБРОБКИ ЕМПІРИЧНИХ ДАНИХ

Для обробки і аналізу емпіричних даних, отриманих в результаті експерименту, психологи застосовують різні методи математичних обчислень. Першим етапом роботи є перевірка гіпотези про вид статистичного розподілу даних. Це необхідно з метою визначення допустимого рівня психологічних вимірювань. Якщо експериментальні дані розподілені згідно нормальному закону розподілу (закону Гаусса - Лапласа) [1] , то в процесі математичного аналізу використовуються методи параметричної статистики, якщо немає - то ненараметріческой. Ненараметріческая статистика визначає отримання даних в рамках умов проведеного експерименту й не припускає поширення їх на інші популяції.

У кожної метричної шкалою застосовуються певні статистичні методи. Методи ненараметріческой статистики застосовуються в номінальній і порядкової шкалах. Параметрична статистика застосовується в інтервального шкалою відносин і більш потужних шкалах. Якщо психолог користується балами і отримує інтервали вимірювання, це не обов'язково означає, що він може застосовувати параметричну статистику. В даному випадку слід ще довести, що отримані результати мають нормальний розподіл даних. Нормальність розподілу показує також здатність застосовуваного дослідником методу оптимально диференціювати піддослідних по вимірюваній ознакою, тобто вказує на його критеріальну валідність.

Будь-яке соціальне дослідження, пов'язане із застосуванням статистики і теорії ймовірностей, пов'язане з вивченням великої кількості людей для узагальнень і типологічних висновків щодо всієї або частини спостерігається популяції. У психометрії (а також інших математичних дисциплінах) ця популяція називається генеральною сукупністю. Психолог не в змозі вивчити властивості всієї популяції. Тому він працює з вибіркою (частиною популяції, групою), а висновки з урахуванням певних процесуальних правил поширює па всю генеральну сукупність.

Таким чином, дослідник, вивчаючи властивості відносно невеликої групи, отримує знання про властивості генеральної сукупності. Характеристики розподілу генеральної сукупності називаються параметрами, а характеристики вибіркового розподілу - оцінками параметрів. Для можливості застосування методів параметричної статистики здійснюється процедура визначення виду статистичного розподілу емпіричних даних.

Метод найменших квадратів у поєднанні з нормальним розподілом емпіричних даних є основою класичної статистики. Однак кожен психолог повинен знати, що припущення про нормальний розподіл даних носять «модельний» характер і не можуть виконуватися абсолютно точно. По теоремі Я. Бернуллі (J. Bernoulli) при нескінченному збільшенні обсягу вибірки емпіричне розподіл по ймовірності прагне до розподілу теоретичному, Г.Є. чим більше кількість спостережень, тим більша ймовірність їх збігу і «більш гладким» буде графік розподілу даних. Теоретично в умовах невизначеності результати психологічних змінних залежать від «випадковості» і визначаються великою кількістю незалежних факторів, вплив яких врахувати неможливо. Але чим більший об'єм емпіричних даних, тим ближче реальний розподіл до теоретично очікуваної нормальної ймовірності. Графік нормального розподілу був вперше побудований математиками К. Гауссом і П. Лапласом в результаті досліджень теорії помилок і методу найменших квадратів. У XIX ст. бельгійський статистик А. Кетле (A. Quetelet) першим застосував поняття нормального розподілу емпіричних даних до дослідження антропометричних якостей людини. Він, зокрема, помітивши схожість графіка нормального розподілу з даними мінливості антропометричних ознак, створив теорію, згідно з якою прагнення дослідників до експериментального «ідеалу» або нормі наштовхується в силу різних обставин на невдачу. Досвід Кетле по застосуванню нормального розподілу був переосмислений і розвинений Ф. Гальтон (F. Galton), який активно застосовував графік нормального розподілу для квантифікації і перетворення даних індивідуальних і групових відмінностей.

Статистичні висновки, складені на основі моделі наближеною до нормального розподілу, носять також більш-менш наближений характер. Оцінка «наближеності» практичної кривої до параметрів нормалі здійснюється за допомогою розрахунку 1) асиметрії і ексцесу і 2) критеріїв згоди Пірсона (Хі-квадрат) (Додаток 7), Колмогорова (1933 г.) і Ясгремского (1949 г.). У першому випадку оцінюється стан вершини емпіричної кривої щодо теоретичної. У другому - певних «ділянок» (груп частот) практичної кривої щодо теоретичної нормалі.

Коефіцієнт асиметрії (Л 5 ) показує величину зсуву вершини емпіричної кривої щодо розрахункової вершини по горизонталі. Коефіцієнт ексцесу х ) визначає «крутизну» практичної кривої (рис. 8.1). Коефіцієнти асиметрії та ексцесу розраховуються за формулами, наведеними в літературі з математичної статистики 1 .

Розподіл емпіричних даних щодо теоретичної кривої (розподіл Гаусса - Лапласа)

Мал. 8.1. Розподіл емпіричних даних щодо теоретичної кривої (розподіл Гаусса - Лапласа)

Межі відхилень від теоретичної кривої, коли можливе застосування методів параметричної статистики, визначаються відповідно до нерівностей П. Л. Чебишева [2] [3] :

1) IA S I <~ JS a / (1-р),

де S a - дисперсія емпіричної оцінки асиметрії; р - ймовірність появи помилки; A s - асиметрія; п - обсяг вибірки (кількість обстежених).

2) 1E X Ie / (1 / •>),

де S e - дисперсія емпіричної оцінки ексцесу; Е х - ексцес.

Оцінка нормальності розподілу емпіричних даних може здійснюватися за допомогою критерію згоди Пірсона, Хі-квадрата (х [3] ), який обчислюється за формулою

де п 1 - частоти тестових даних; я, - 0 - теоретичні частоти.

Визначається ймовірність відповідності практичної частоти прояву ознаки (за показниками тесту) з теоретичним розподілом (за спеціальними таблицями) (Додаток 8). Оцінка розподілу по у} на практиці здійснюється автоматизовано.

В результаті дослідження параметрів розподілу емпіричних даних психолог може зробити принаймні два практичних виведення:

  • 1) розподіл даних «близько» (чи ні) до нормального теоретичного розподілу, і звідси можливе застосування методів параметричної статистики;
  • 2) методика оптимально (чи ні) диференціює випробовуваних по вимірюваній ознакою і в цілому відображає (чи ні) властивість досліджуваної популяції.

У практиці психологічних досліджень розподілу емпіричних даних можливо прояв принаймні трьох видів кривих: симетричне, асиметричне ( «скошене») і бімодальне розподіл 1 (Додаток 9).

Основними факторами, що впливають па форму графіка розподілу емпіричних даних в психологічних дослідженнях, є: неадекватність вибірки, використання невалидность або ненадійних засобів вимірювання психологічних змінних і неадекватні умови, що безпосередньо впливають на досліджуване якість.

Особливо слід підкреслити, що неадекватність вибірки має місце в результаті відбору випробовуваних, коли в ході діагностики, відсіваючи людей, що показують незадовільні результати, крива нормального розподілу перетворюється в / -Кривий Пуассона. Зокрема, розподіл психологічних даних в формі / -Кривий вперше використав Ф. Оллпорт (Allport) (1934 г.) для вивчення соціального конформізму.

Застосування методів статистики в процесі аналізу емпіричних даних. Методи непараметричної статистики застосовуються у випадках, коли показники тестів розподілені ненормально або розподіл невідомо, тобто непараметричні методи статистики не передбачають знання функціонального виду генеральних розподілів. Деякі дослідники відзначають, що поширення методів непараметричної статистики сильно стримується відсутністю навчальних посібників з цього предмету [5] [6] .

У практичній роботі психологів з метою статистичної оцінки центральної тенденції використовують моду (М 0 ), тобто найбільш імовірна поява показника, і медіану (М з ) - варіант, який припадає на середину рангового варіаційного ряду. Заходи центральної тенденції визначають статистичну «точку відліку», яка є умовним центром виявленого психологічного ознаки. Як заходів мінливості застосовується «розмах», який являє собою смугу розкиду експериментальних даних від мінімальних до максимальних значень. Заходами зв'язку емпіричних змінних є коефіцієнт згоди, коефіцієнти контингенции, асоціації, коефіцієнти спряженості, коефіцієнт рангової кореляції та ін. Як статистичних критеріїв використовуються: критерій Манна - Уїтні, заснований на парному порівнянні результатів; критерій Уилкоксона, що базується на переході від спостережень до їх рангами; критерій згоди Пірсона (х [7] [8] ), заснований на наближенні частоти прояву ознаки в різних вибірках ( Додаток 10), та ін. 1

Параметрична статистика застосовується у випадках, коли емпіричні показники виміряні в інтервального шкалою, шкалою відносин або абсолютної шкалою в умовах нормального розподілу експериментальних змінних. Як заходів центральної тенденції використовуються мода (М 0 ), медіана (М е ) і середнє значення, або математичне очікування х ). Вимірювання розсіювання (заходів мінливості) здійснюється за допомогою дисперсії (D x ) і середньоквадратичного відхилення (5 Г ), а також коефіцієнта варіації (V). Як заходів зв'язку використовуються коефіцієнти кореляції. Для статистичного виведення використовуються статистичні критерії і моделі. До перших можна віднести ^ критерій Стиодента, о-критерій Велша ( Welch's t-test) і ін. Статистичне моделювання розвитку і змін психологічних змінних здійснюється за допомогою методів лінійної та нелінійної регресії (моделі регресії).

Статистичні методи застосовуються в певному довірчому інтервалі, який задається виходячи з потреб точності вимірювань. Довірчим інтервалом називається інтервал ( X ± г), який «накриває» невідомий параметр із заданою точністю. У біологічних і соціальних дослідженнях максимальне значення г задається в межах 5%, тобто s <0,05. З поняттям «довірчий інтервал» тісно пов'язаний термін «рівень статистичної значущості», тобто «Ступінь відтворюваності подібних результатів при повторному дослідженні» [8] . Значним рівня статистичної значущості, часто фігурують в психологічних публікаціях, є р = 0,05. Це означає, що помилка психологічних вимірювань можлива в п'яти випадках зі 100, а статистично значущою буде отримана інформація в 95 випадках з 100.

Основний мірою центральної тенденції в параметричному вимірі є середнє значення (математичне очікування). Мінливість ознак в параметричних шкалах вимірюється за допомогою дисперсії і середньоквадратичного відхилення (5 V ) [10] . Середньоквадратичне відхилення визначається як арифметичне значення квадратного кореня з дисперсії, яка є середня арифметична квадратів відхилень окремих значень виміряного властивості від їх середнього значення. Коефіцієнт кореляції (R) показує наявність статистичного зв'язку між психологічними змінними х і г /, при якій кожноїзмінної х відповідає розподіл у, мінливий разом зі зміною х , яке може бути односпрямованим (+) і різноспрямованим (-).

Теоретична інтерпретація параметричного коефіцієнта кореляції подібна іншим статистикам з області вимірювання зв'язків між змінними. Якщо значення R більше 0,5, то має місце статистично сильний зв'язок, якщо менше 0,5 - слабка. Позитивні і негативні знаки показують спрямованість зв'язку (відповідно прямий і зворотній). При певній кількості вимірювань (п) кореляційні зв'язки можуть бути значущими і незначущими. Це необхідно знати досліднику для того, щоб зробити достовірний висновок про причинно-наслідкові зв'язки змінних. Рівень значущості коефіцієнтів кореляції визначається за формулою розрахунку критеріїв за допомогою відповідних таблиць. Для прийняття рішення за рівнем значущості R:

  • 1) проводиться розрахунок значення критерію (за формулою);
  • 2) за обсягом вибірки (п - 1) здійснюється «вхід» в таблицю ( Додаток 11);
  • 3) розрахункове значення критерію порівнюється з табличним;
  • 4) якщо розрахункове значення більше за абсолютною величиною табличного, то R має значимість на відповідному рівні довірчої ймовірності. Рівень значущості коефіцієнта кореляції залежить від обсягу експериментальної вибірки і від величини коефіцієнта кореляції ( Додаток 12).

Розрахунок коефіцієнтів кореляції є інструментом, що дозволяє здійснити кореляційний, факторний та кластерний аналізи емпіричних даних. В основі факторного і кластерного аналізів покладено уявлення про кореляційних залежностях. Кореляційний аналіз (лат. Correlatio - співвідношення, зв'язок, залежність) - це комплексний метод дослідження взаємозалежності ознак у генеральній сукупності, які є випадковими величинами і статистично зв'язаними. Кореляційний аналіз, як правило, здійснюється з експериментальними змінними, що мають нормальне багатовимірне розподіл. Процедури кореляційного аналізу дозволяють визначити ступінь значущості зв'язку, встановити силу і напрям впливу системи змінних (А, Б, В) на залежну змінну, а також кореляційний структуру як залежною, так і незалежної змінної в ході експерименту.

Факторний аналіз - це розділ багатовимірного статистичного аналізу, сутність якого полягає у виявленні безпосередньо не вимірюється (прихованого) ознаки, що є «головною компонентою» (похідною) групи виміряних тестових показників. Творець факторного аналізу Ч. Спірман (Ch. Spearman) виявив латентну (приховану) складову інтелекту (1904 г.), що поклало початок нескінченним пробам факторизации психологічних змінних. Центральним завданням даного методу є перехід від сукупності безпосередньо вимірюваних ознак до системоутворюючим факторів, за якими стоять емпіричні дані, що відображають реальні психологічні структури. Сам фактор є відображенням реальності. Він покликаний, але влучним висловом Л. Терстоуна (L. Thurstone), «конденсувати» результати психологічних вимірювань, спрощувати (редукувати), скорочувати їх і перетворювати матерію цифр в «дух» психологічної науки. Це воістину «самий психологічний з усіх статистичних методів». Наочно фактор (F) може бути представлений у вигляді моделі «прошивання» виміряних змінних (А, Б, В) з метою виявлення загального істотного елементу, що відображає головну особливість цих приватних змінних (рис. 8.2).

Модель факторного аналізу

Мал. 8.2. Модель факторного аналізу

Дані кореляційного і факторного аналізів допомагають виявити взаємозв'язку між змінними, але, як вважають деякі дослідники, не можуть дати достатніх підстав для висновків про причинно-наслідкові залежності і про ієрархію причинних зв'язків. Виділення факторів більш високого порядку і інші модифікації суті методу не змінюють. Яку б понятійну систему психолог ні використовував, в ній неодмінно закладений принцип причинності, який пронизує будь-яку концепцію. У цьому виявляється істотна розбіжність понятійного і факторного описів психічних явищ. Ніяка формалізована процедура не може замінити концептуальні уявлення і логіку дослідника. У факторному аналізі передбачається, що спостережувані змінні є математичної комбінацією деяких латентних (гіпотетичних або неспостережуваних, прихованих) факторів. Однак досвід і наявність додаткової інформації про структуру досліджуваного явища дозволяють досить коректно інтерпретувати результати факторного аналізу.

В експериментальній психології факторний аналіз використовується досить широко і часто механічно, без урахування його можливостей. Схеми факторного аналізу мозаїчні. За свідченням Б. В. Кулагіна, у дослідників поки «немає загальноприйнятої процедури факторного аналізу, є істотні розбіжності в поглядах на прийнятність і обгрунтованість різних алгоритмів і підходів» [11] .

Л. В. Куликов рекомендує дотримуватися ряду основних вимог для коректного застосування факторного аналізу 1 . По-перше, змінні повинні бути виміряні, по крайней мере, на рівні ординальне або шкали інтервалів (але класифікації С. Стівенса). По-друге, відбираючи змінні для факторного аналізу, слід враховувати, що на один фактор має припадати принаймні три змінні. По-третє, для обґрунтованого рішення необхідно, щоб число експериментальних змінних не перевищувало однієї третини від числа досліджуваних. Необхідно завжди віддавати собі звіт, що дослідницька практика постійно вносить корективи і тому експериментатору слід виходити з того, що чим сильніше порушується це правило, тим менш точні будуть результати. По-четверте, не має сенсу включати в факторний аналіз змінні, які мають дуже слабкі кореляційні зв'язки з іншими змінними, тому що вони будуть мати малу спільність і не увійдуть ні в один фактор. По-п'яте, найважливішим моментом пошуку хорошого факторного рішення є визначення числа факторів перед їх обертанням. В остаточному рішенні найкраще грунтуватися на змістовних припущеннях про структуру досліджуваного явища.

При виборі змінних і скорочення їх кількості для наступного циклу факторного аналізу можна використовувати змінні, якщо відбирати їх але факторним спільнотам. При інтерпретації чинників можна почати роботу з того, що виділити найбільші факторні навантаження в даному факторі. Для виділення можна використовувати прийоми, аналогічні виділенню значимих коефіцієнтів кореляції, множинної детермінації, а також розрахунки інтенсивності і експансивність факторів [12] [13] .

Кластерний аналіз - сукупність статистичних та інших, в тому числі якісних, методів, призначених для диференціації щодо «віддалених» один від одного груп і «близьких» між собою об'єктів за інформацією про зв'язки або заходи близькості між ними. В ході дослідження проявів типових ознак часто користуються процедурою кластерного аналізу. Типологія визначається шляхом виявлення ознак, близьких до еталону за їх дисперсії. В цьому випадку кореляція здійснюється не між змінними, а між суб'єктами, носіями ознак. Близькість визначається за найменшою дисперсії реальних носіїв ознак щодо ознак еталона.

Стандартизація. Будь-яке вимірювання припускає наявність якоїсь одиниці, яка виконує функцію міри, співвідносячи вимірювані явища або позиції. Одиниці виміру повинні бути порівняні і незмінні, тобто бути стандартними.

Стандартизація передбачає як стандартні умови, так і стандартні одиниці виміру і є процесом уніфікації, регламентації, приведення до єдиних нормативів процедури експерименту і виміряних психологічних показників. Стандартизація служить перш за все для створення умов і можливості зіставлення експериментальних даних, отриманих за допомогою методик різної розмірності. В результаті обробки тестових показників отримують сирі бали, які переводяться в стандартні оцінки, побудовані відповідно до закону нормального розподілу.

Розрізняють дві форми стандартизації. Перша форма зводиться до постійного алгоритму обробки даних, регламентації процедури проведення експерименту, періодичності обстеження випробовуваних, уніфікації інструкції, способів реєстрації результатів, постійності умов проведення дослідження, характеристик контингенту обстежуваних і т.д. Друга форма передбачає функцію перетворення нормальної (або штучно нормализованной) шкали оцінок у нову шкалу, засновану на визначенні місця сирої оцінки випробуваного в розподілі показників психологічної методики на репрезентативній вибірці.

Найбільш поширеними перетвореннями в психометрії первинних оцінок є центрування і нормування за допомогою середньоквадратичних відхилень. Центрування - его лінійна трансформація величин виміряного ознаки, при якій середня величина розподілу стає рівною нулю. Процедура нормування полягає в переході до іншого масштабу (одиницям) вимірювання (S c ), який базується на принципі нормальності розподілу емпіричних показників при переході до стандартних величин і здійснюється за формулою

де Xj - величина показника тесту; М х . - середнє арифметичне показників; § ,. - середньоквадратичне відхилення показників; А - заданий середньоквадратичне відхилення; М - заданий середнє значення.

В якості опції S c зазвичай використовують Z-показник (стандартний показник), що виражає відхилення індивідуального результату Xj в одиницях, пропорційних стандартного відхилення одиничного нормального розподілу, тобто М- 0, а А = 1. При цьому Z-показник визначається за формулою: Z = (х, - М х ) / 5 Г

У психологічній практиці найбільш часто використовуються в якості стандартних оцінок: процентилю [14] (перцентілі), типові стандартні Z-оцінки (М = О, А = 1), стандартні / Q-бали (М = 100, А = 15), Г -ноказателі = 50, А - 10) і стінна шкала (М - 5,5, А = 2).

  • [1] Одна з назв нормального розподілу, яке поряд з іншими назвами (Гаусса закон, гауссовское розподіл, другий закон Лапласа, Лапласа - Гаусса розподіл і т.д.) пов'язує історію відкриття і перших додатків розподілу до різних завдань теорії ймовірностей з іменами До . Гаусса (С. Gauss) і II. Лапласа (Р. Laplace) .Нормальное розподіл з'явилося у К. Гаусса (1809 г.) і П. Лапласа (1812 г.) в связіс дослідженнями теорії помилок і методу найменших квадратів (див .: Математіческійенціклопедіческій словник / гл. Ред. Ю. В. Прохоров. М .: Радянська енциклопедія, 1988.С. 140).
  • [2] Див .: Карасьов А. І. Основи математичної статистики. М.: Росвузіздат, 1962; Суходольський Г. В. Основи математичної статистики для психологів. Л., 1972; Гмурман В. Е.Теорія ймовірностей і математична статистика: підручник. 12-е изд. М.: Юрайт, 2014; Сидоренко Е. В. Методи математичної обробки в психології. СПб .: Речь, 2004; та ін.
  • [3] У практиці професійного психологічного відбору часто користуються правіломнепревишенія помилок асиметрії і ексцесу по абсолютній величині не більше ніж в 3 рази.
  • [4] У практиці професійного психологічного відбору часто користуються правіломнепревишенія помилок асиметрії і ексцесу по абсолютній величині не більше ніж в 3 рази.
  • [5] Див .: Носі І. І. Експериментальна психологія: навч, посібник для вузів. М.: Психотерапія, 2010 року.
  • [6] Див .: Суходольський Г. В. Основи математичної статистики для психологів. Л., 1972; Гласс Дж., Стенлі Дж. Статистичні методи в педагогіці і психології. М., 1976; Математичні методи аналізу та інтерпретація соціологічних даних. М., 1989.
  • [7] х2 може використовуватися в якості критерію і коефіцієнта кореляції.
  • [8] Див .: Апастазі А. Диференціальна психологія. Індивідуальні та групові відмінності в поведінці: пров. з англ. М .: Квітень Прес; Ексмо-Пресс, 2001. С. 15-18.
  • [9] Див .: Апастазі А. Диференціальна психологія. Індивідуальні та групові відмінності в поведінці: пров. з англ. М .: Квітень Прес; Ексмо-Пресс, 2001. С. 15-18.
  • [10] Середньоквадратичне відхилення позначається як середньоквадратичне отклоненіеілі стандарт (див .: Прикладна математика. М .: ВПА, 1986. С. 122; Осипов Г. В., Андрєєв Е. П.Методи вимірювання в соціології. М .: Наука, 1977 . С. 74; і ін.).
  • [11] Кулагін Б. В. Основи професійної психодіагностики. Л .: Медицина, 1984. С. 17.
  • [12] Див .: Куликов Л. В. Психологічне дослідження: методич. рекомендації по проведенню. СПб .: Наука, 2000..
  • [13] Див .: Носі І. II., Носі II. В. Психологія управлінням персоналом. Профессіологіческійаспект. М .: КСП +, 2002.
  • [14] відсотків і перцентілі не слід змішувати з процентними показниками (див.: Анастаж Л., Урбіна С. Психологічне тестування. СПб., 2001. С. 75; Кулагін Б. В. Указ, соч. С. 16-17; Шмельов А. Г. Практична тестология. Тестування в освіті, прикладної психології та управлінні персоналом. М .: Маска, 2013. С. 261-266).
 
<<   ЗМІСТ   >>