Головна Природознавство
БІЗНЕС-СТАТИСТИКА
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АНАЛІЗ ВАРІАЦІЇ І КОРРЕЛЯЦИИВ результаті вивчення глави 3 студент повинен: знати
Аналіз варіаціїПервинна обробка даних включає ранжування по зростанням або за спаданням значень змінної х, розрахунок середнього значення, моди, медіани, розкиду значень (x max , x min ), середнього відхилення від середньої, коефіцієнта варіації, а також характеристик форми розподілу, таких як асиметрія і ексцес. Розглянемо приклад. На підставі обліку відпрацьованого часу було розраховано середнє число годин понаднормового часу, відпрацьованого кожним з 50 працівників підприємства в середньому за тиждень другого кварталу (квітень-червень) (табл. 3.1). юз Початкові дані
Всі працівники впорядковані від мінімального до максимального кількості годин понаднормової роботи. Мінімальна кількість понаднормових дорівнює нулю, максимальне - 12 ч. Розрахуємо інтервал для проведення угруповання (i x ):
Якщо прийняти число груп, рівне т = 3, то отримаємо таку угруповання (табл. 3.2), де / -Частота (frequency) появи значення х. Отримана угруповання не розкриває характеру розподілу. Керівництво підприємства має потребу в розумінні закономірності понаднормових: адже вони оплачуються за підвищеним тарифом, що впливає на обсяг витрат (витрат). Для більшої деталізації приймемо число груп, рівне 6 (табл. 3.3). Тоді інтервал угруповання складе
Таблиця 3.2 результат угруповання
Таблиця 3.3 результат угруповання
Розрахуємо середню кількість відпрацьованих понаднормових годин по згрупованим даними:
за даними прикладу х = 6,56 ч. Середнє квадратичне відхилення по згрупованим даними розраховується за формулою
за даними прикладу ст А . = 2,6 год. Показник асиметрії має вигляд
за даними прикладу As = -0,22. Значення As дозволяє зробити висновок, що асиметрія несуттєва, негативна, тобто модальное число понаднормових (від 6 до 8 год) злегка зміщене вліво від середньої, Мо < х. Можна очікувати на підприємстві тенденції зменшення понаднормових. Покажемо на графіку криву нормального розподілу (рис. 3.1). Розглядається розподіл досить близько до нормального, тобто на число годин понаднормових впливає безліч випадкових причин, жодна з яких не є визначальною. ![]() Мал. 3.1. Крива нормального розподілу - симетрична (нульова скошенность і нульовий ексцес) На рис. 3.2 представлені нормальне і асиметричні розподілу, часто зустрічаються в конкретних завданнях. Асиметрію вимірюють як через різницю ( х-Мо ), так і через центральний момент третього порядку, д 3 : ![]() ст 3 - середнє відхилення в третього ступеня. Якщо As> 0, то асиметрія правостороння, якщо As <0, то асиметрія левостронняя. Ексцес характеризує крутизну (гостровершинності) розподілу. Показник ексцесу будується як відхилення від Ех = 3 (для нормального розподілу):
де / г 4 - центральний момент четвертого порядку; а 4 - середнє відхилення в четвертого ступеня. На рис. 3.3 показані нормальне і плосковершіннное розподілу ![]() Мал. 3.2. Нормальне (Л) і асиметричні розподілу (В - правобічна асиметрія, С - лівостороння асиметрія) ![]() Мал. 3.3. Нормальне і плосковершінних розподілу (з негативним ексцесом) Гостровершинності розподілу свідчить про високу однорідності даних, плосковершінних - про значну дисперсії (неоднорідності). Оскільки в розглянутому прикладі асиметрія невелика, перевіримо гіпотезу про нормальність розподілу. Щільність нормального розподілу Дх) розраховується за формулою
х - х Якщо від х перейти до z, де z = -, то а = 1, z = 0. В цьому випадку фор- ст мула щільності розподілу cp (z) має вигляд
Знайдемо параметри кривої по емпіричним даним (табл. 3.4). Таблііа 3.4 Розрахунок теоретичних частот
Розрахуємо нормоване відхилення z, далі по таблиці розподілу ф (г) знаходимо значення функції, потім визначаємо теоретичні частоти за формулою
де п - обсяг вибірки; i - інтервал. Результати розрахунків представлені на рис. 3.4. ![]() Мал. 3.4. Емпіричне і теоретичне розподіл числа працівників за кількістю відпрацьованих понаднормових годин Виконаємо статистичну перевірку висунутої гіпотези про приналежність даного розподілу до нормального. Для цього розрахуємо критерій згоди Пірсона у 2 :
Табличне значення критерію у} (а = 0,05; dj- = 6-3 = 3) одно 7,81. Табличне значення критерію згоди більше фактичного, отже, гіпотеза приймається. З імовірністю 95% можна стверджувати, що в основі досліджуваного розподілу лежить закон нормального розподілу. Для стійкості багатьох моделей в області економіки, фінансів, управління ризиками, економетрики та страхування велике значення має тяжкість хвостів розподілів. Наявність таких хвостів характерно для рідкісних подій. У випадках, коли рідкісними подіями не можна знехтувати, а середні значення є неінформативними, можна говорити про аналіз розподілів з важкими хвостами. Розподіл має важкий хвіст, якщо його щільність розподілу убуває повільніше щільності розподілу експоненціального закону, тобто
Більш суворе математичне визначення розподілів з важкими хвостами дається в дисертації С. Ю. Новака: • для лівого хвоста розподілу
де L (x) убуває повільно, тобто
• для правого хвоста розподілу
а> 0 - показник швидкості убування хвоста розподілу. При цьому збіжність по t має стало компактних множинах. Як показав Р. Ібрагімов, в моделях вартісної міри ризику (VaR) диверсифікація стає субоптимальність, якщо розподілу розглянутих ризиків мають дуже важкі хвости, ризики з індексом тяжкості z <1 і нескінченними середніми. Для ризиків, розподілу яких мають помірно важкі хвости з індексом тяжкості z > 1 і кінцевими першими моментами, диверсифікація є оптимальною. Р. Ібрагімовим і Дж. Вальденом показано, що для продуктів з низькими граничними витратами оптимальна стратегія продавця полягає в продажу товарів окремо, якщо розподіл цінності товарів для споживачів має дуже важкі хвости. якщо ж це розподіл має помірно важкі хвости, оптимальною стратегією для монополіста є продаж товарів в єдиному пакеті. Р. Ібрагімов обгрунтував, що якщо розподілу сигналів, які фірми отримують від споживачів, мають помірно важкі хвости і фірми використовують для оцінки ідеального продукту вибіркове середнє, то число і типи учасників ринку мають виражену залежність від їх значень в минулому. В таких умовах великі фірми мають перевагу перед фірмами меншого розміру. Це властивість замінюється на протилежне в разі сигналів з дуже важкими хвостами розподілів. В такому випадку, з великою часткою ймовірності фірми меншого розміру можуть стати великими в наступному періоді і навпаки, розмір великих фірм зменшиться. Твердження, що динаміка показників розподілу може служити індикатором еволюції структури сукупності, висловив М. М. Юзбашев (1984). Як бачимо, аналіз характеру розподілу і варіації дозволяє відповісти на багато питань. Перш за все, це стосується оцінки ризику: чим вище варіація, тим вище ризик (див. Гл. 10). Показники варіації і характеристики центру розподілу допомагають вирішити, наприклад, таку важливу задачу, як ймовірність виїзної податкової перевірки. Відповідь на це питання може бути отриманий шляхом виконання наступних етапів роботи:
Середнє значення - це величина ознаки, яка припадала б на кожну одиницю сукупності при рівномірному розподілі всього обсягу ознаки між ними. Мода - значення ознаки з найбільшою частотою появи, медіана - значення ознаки в середині ряду розподілу. Досить часто в економічних дослідженнях спостерігаються без- модальні (рівномірні) сукупності спостережень. Показником, що характеризує збіг характеристик центру розподілу, Мо їх є коефіцієнт асиметрії. Якщо розподіл значень досліджуваного показника симетрично, то медіана і мода збігаються із середньою, коефіцієнт асиметрії дорівнює нулю: Еталонне значення визначається як характеристика центру розподілу. Значення показника є типовим, якщо воно є одночасно середньої, медианой і модою: по
Коефіцієнт асиметрії може бути близький до нуля, але не дорівнює йому. Для оцінки значущості відхилення коефіцієнта асиметрії від нульового значення розраховується середня квадратична помилка коефіцієнта асиметрії за формулою
де п - число спостережень. Якщо виконується співвідношення
то асиметрія вважається статистично незначною. В іншому випадку робиться висновок про наявність значущої асиметрії. На практиці в якості критичного значення приймають As = 0,5, посилюючи тим самим точність висновків. Якщо критичне значення коефіцієнта асиметрії As> 0,5, то сукупність неоднорідна і середнє значення не є типовим. Якщо коефіцієнт асиметрії негативний, то це означає, що велика частина спостережень має значення показника нижче середнього і мода з медіаною зміщені в бік менших значень в порівнянні з середньою. При позитивній асиметрії спостерігається зворотне співвідношення. Виходячи з цього, методика визначення еталонного значення показника включає наступні кроки.
• середнє значення
де х, - значення аналізованого ознаки для i-ro підприємства; п * - кількість підприємств (без віддалених). Потім розраховується коефіцієнт асиметрії. Середнє квадратичне відхилення визначається за формулою
ш 4. Значення коефіцієнта асиметрії порівнюється з критичним значенням As = 0,5. Якщо фактичне значення коефіцієнта асиметрії по модулю нижче критичного | As | <0,5, то сукупність визнається симетричною щодо середнього значення і в якості еталонного приймається знайдене середнє значення (х *). при | As | > 0,5 необхідно провести процедуру усунення асиметрії відповідно до п. 1-3. 5. Для всіх значень показника знаходиться величина відхилення індивідуального значення від середнього по сукупності (d,):
6. Визначається максимальне абсолютне відхилення d ,:
Результатами реалізації процедури виявлення еталонних значень показника є:
По завершенні формування еталонних значень показника виконується процедура аналізу варіації індивідуальних значень показника за відхиленнями від еталонного. Дана процедура ґрунтується на тому положенні, що в нормально розподіленої сукупності ймовірність отримати відхилення індивідуального значення від середнього (в нашому випадку-еталонного) становить менше 1%. Виділені хвостові значення утворюють зону ризику, тобто це ті підприємства, для яких шанс виїзної податкової перевірки вищий, ніж для підприємств, що тяжіють до центру розподілу. |
<< | ЗМІСТ | >> |
---|