Повна версія

Головна arrow Природознавство arrow БІЗНЕС-СТАТИСТИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

АНАЛІЗ ВАРІАЦІЇ І КОРРЕЛЯЦИИ

В результаті вивчення глави 3 студент повинен: знати

  • • значення варіації і методи вимірювання варіації;
  • • показники центру і характеру розподілу;
  • • методи побудови парних і множинних рівнянь регресії; вміти
  • • аналізувати варіацію, виявляти закон розподілу;
  • • спільно розглядати показники центру розподілу і варіації;
  • • оцінюють однорідність даних;
  • • вимірювати диференціацію явища, використовуючи структурні показники ряду розподілу;
  • • вимірювати кореляцію;
  • • вивчати залежності, будувати рівняння регресії;
  • • аналізувати у взаємозв'язку економічні явища і процеси;
  • • аналізувати та інтерпретувати дані статистики про бізнес-процеси та явища;
  • • виявляти тенденції зміни процесів; володіти
  • • методикою побудови рада розподілу,
  • • методикою виявлення закону розподілу;
  • • методикою побудови рівнянь парної і множинної регресії;
  • • програмними засобами аналізу варіації і кореляції.

Аналіз варіації

Первинна обробка даних включає ранжування по зростанням або за спаданням значень змінної х, розрахунок середнього значення, моди, медіани, розкиду значень (x max , x min ), середнього відхилення від середньої, коефіцієнта варіації, а також характеристик форми розподілу, таких як асиметрія і ексцес.

Розглянемо приклад. На підставі обліку відпрацьованого часу було розраховано середнє число годин понаднормового часу, відпрацьованого кожним з 50 працівників підприємства в середньому за тиждень другого кварталу (квітень-червень) (табл. 3.1).

юз

Початкові дані

номер

працівника

Кількість понаднормових годин на тиждень х

номер

працівника

Кількість понаднормових, годин в тиждень х

1

0

26

6

2

1

27

7

3

2

28

7

4

2

29

7

5

3

30

7

6

3

31

7

7

2

32

7

8

2

33

7

9

4

34

7

10

4

35

7

11

4

36

7

12

4

37

8

13

4

38

8

14

4

39

8

15

4

40

8

16

5

41

9

17

5

42

9

18

5

43

9

19

5

44

9

20

5

45

10

21

5

46

10

22

6

47

11

23

6

48

11

24

6

49

11

25

6

50

11

Всі працівники впорядковані від мінімального до максимального кількості годин понаднормової роботи. Мінімальна кількість понаднормових дорівнює нулю, максимальне - 12 ч. Розрахуємо інтервал для проведення угруповання (i x ):

Якщо прийняти число груп, рівне т = 3, то отримаємо таку угруповання (табл. 3.2), де / -Частота (frequency) появи значення х. Отримана угруповання не розкриває характеру розподілу. Керівництво підприємства має потребу в розумінні закономірності понаднормових: адже вони оплачуються за підвищеним тарифом, що впливає на обсяг витрат (витрат). Для більшої деталізації приймемо число груп, рівне 6 (табл. 3.3). Тоді інтервал угруповання складе

Таблиця 3.2

результат угруповання

Кількість відпрацьованих понаднормових годин на тиждень х

Число осіб /

0-4

15

4-8

25

8-12

10

Таблиця 3.3

результат угруповання

Кількість відпрацьованих понаднормових годин х

Число осіб /

0-2

2

2-4

6

4-6

13

6-8

15

8-10

8

10-12

6

Разом

50

Розрахуємо середню кількість відпрацьованих понаднормових годин по згрупованим даними:

за даними прикладу х = 6,56 ч.

Середнє квадратичне відхилення по згрупованим даними розраховується за формулою

за даними прикладу ст А . = 2,6 год.

Показник асиметрії має вигляд

за даними прикладу As = -0,22. Значення As дозволяє зробити висновок, що асиметрія несуттєва, негативна, тобто модальное число понаднормових (від 6 до 8 год) злегка зміщене вліво від середньої, Мо < х. Можна очікувати на підприємстві тенденції зменшення понаднормових.

Покажемо на графіку криву нормального розподілу (рис. 3.1). Розглядається розподіл досить близько до нормального, тобто на число годин понаднормових впливає безліч випадкових причин, жодна з яких не є визначальною.

Крива нормального розподілу - симетрична (нульова скошенность і нульовий ексцес)

Мал. 3.1. Крива нормального розподілу - симетрична (нульова скошенность і нульовий ексцес)

На рис. 3.2 представлені нормальне і асиметричні розподілу, часто зустрічаються в конкретних завданнях. Асиметрію вимірюють як через різницю ( х-Мо ), так і через центральний момент третього порядку, д 3 :

ст 3 - середнє відхилення в третього ступеня.

Якщо As> 0, то асиметрія правостороння, якщо As <0, то асиметрія левостронняя.

Ексцес характеризує крутизну (гостровершинності) розподілу. Показник ексцесу будується як відхилення від Ех = 3 (для нормального розподілу):

де / г 4 - центральний момент четвертого порядку; а 4 - середнє відхилення в четвертого ступеня.

На рис. 3.3 показані нормальне і плосковершіннное розподілу

Нормальне (Л) і асиметричні розподілу (В - правобічна асиметрія, С - лівостороння асиметрія)

Мал. 3.2. Нормальне (Л) і асиметричні розподілу (В - правобічна асиметрія, С - лівостороння асиметрія)

Нормальне і плосковершінних розподілу (з негативним ексцесом)

Мал. 3.3. Нормальне і плосковершінних розподілу (з негативним ексцесом)

Гостровершинності розподілу свідчить про високу однорідності даних, плосковершінних - про значну дисперсії (неоднорідності). Оскільки в розглянутому прикладі асиметрія невелика, перевіримо гіпотезу про нормальність розподілу.

Щільність нормального розподілу Дх) розраховується за формулою

х - х

Якщо від х перейти до z, де z = -, то а = 1, z = 0. В цьому випадку фор-

ст

мула щільності розподілу cp (z) має вигляд

Знайдемо параметри кривої по емпіричним даним (табл. 3.4).

Таблііа 3.4

Розрахунок теоретичних частот

Кількість відпрацьованих понаднормових годин х

Число осіб, f i

* «

X; - X

z = ---

а

Ф (г)

//

0-2

2

1

-2,14

0,0404

2

2-4

6

3

-1,37

0,1561

6

4-6

13

5

-0,60

0,3332

13

6-8

15

7

0,17

0,3932

15

8-10

8

9

0,94

0,2565

10

10-12

6

11

1,71

0,0925

4

Разом

50

-

-

-

50

Розрахуємо нормоване відхилення z, далі по таблиці розподілу ф (г) знаходимо значення функції, потім визначаємо теоретичні частоти за формулою

де п - обсяг вибірки; i - інтервал.

Результати розрахунків представлені на рис. 3.4.

Емпіричне і теоретичне розподіл числа працівників за кількістю відпрацьованих понаднормових годин

Мал. 3.4. Емпіричне і теоретичне розподіл числа працівників за кількістю відпрацьованих понаднормових годин

Виконаємо статистичну перевірку висунутої гіпотези про приналежність даного розподілу до нормального. Для цього розрахуємо критерій згоди Пірсона у 2 :

Табличне значення критерію у} (а = 0,05; dj- = 6-3 = 3) одно 7,81. Табличне значення критерію згоди більше фактичного, отже, гіпотеза приймається. З імовірністю 95% можна стверджувати, що в основі досліджуваного розподілу лежить закон нормального розподілу.

Для стійкості багатьох моделей в області економіки, фінансів, управління ризиками, економетрики та страхування велике значення має тяжкість хвостів розподілів. Наявність таких хвостів характерно для рідкісних подій.

У випадках, коли рідкісними подіями не можна знехтувати, а середні значення є неінформативними, можна говорити про аналіз розподілів з важкими хвостами. Розподіл має важкий хвіст, якщо його щільність розподілу убуває повільніше щільності розподілу експоненціального закону, тобто

Більш суворе математичне визначення розподілів з важкими хвостами дається в дисертації С. Ю. Новака:

• для лівого хвоста розподілу

де L (x) убуває повільно, тобто

• для правого хвоста розподілу

а> 0 - показник швидкості убування хвоста розподілу.

При цьому збіжність по t має стало компактних множинах.

Як показав Р. Ібрагімов, в моделях вартісної міри ризику (VaR) диверсифікація стає субоптимальність, якщо розподілу розглянутих ризиків мають дуже важкі хвости, ризики з індексом тяжкості z <1 і нескінченними середніми. Для ризиків, розподілу яких мають помірно важкі хвости з індексом тяжкості z > 1 і кінцевими першими моментами, диверсифікація є оптимальною.

Р. Ібрагімовим і Дж. Вальденом показано, що для продуктів з низькими граничними витратами оптимальна стратегія продавця полягає в продажу товарів окремо, якщо розподіл цінності товарів для споживачів має дуже важкі хвости. якщо

ж це розподіл має помірно важкі хвости, оптимальною стратегією для монополіста є продаж товарів в єдиному пакеті.

Р. Ібрагімов обгрунтував, що якщо розподілу сигналів, які фірми отримують від споживачів, мають помірно важкі хвости і фірми використовують для оцінки ідеального продукту вибіркове середнє, то число і типи учасників ринку мають виражену залежність від їх значень в минулому. В таких умовах великі фірми мають перевагу перед фірмами меншого розміру. Це властивість замінюється на протилежне в разі сигналів з дуже важкими хвостами розподілів. В такому випадку, з великою часткою ймовірності фірми меншого розміру можуть стати великими в наступному періоді і навпаки, розмір великих фірм зменшиться.

Твердження, що динаміка показників розподілу може служити індикатором еволюції структури сукупності, висловив М. М. Юзбашев (1984).

Як бачимо, аналіз характеру розподілу і варіації дозволяє відповісти на багато питань. Перш за все, це стосується оцінки ризику: чим вище варіація, тим вище ризик (див. Гл. 10).

Показники варіації і характеристики центру розподілу допомагають вирішити, наприклад, таку важливу задачу, як ймовірність виїзної податкової перевірки. Відповідь на це питання може бути отриманий шляхом виконання наступних етапів роботи:

  • 1) формування еталонних показників;
  • 2) виявлення узгодженості зміни показників;
  • 3) визначення черговості відбору організацій для податкової перевірки.

Середнє значення - це величина ознаки, яка припадала б на кожну одиницю сукупності при рівномірному розподілі всього обсягу ознаки між ними. Мода - значення ознаки з найбільшою частотою появи, медіана - значення ознаки в середині ряду розподілу.

Досить часто в економічних дослідженнях спостерігаються без- модальні (рівномірні) сукупності спостережень. Показником, що характеризує збіг характеристик центру розподілу, Мо їх є коефіцієнт асиметрії.

Якщо розподіл значень досліджуваного показника симетрично, то медіана і мода збігаються із середньою, коефіцієнт асиметрії дорівнює нулю:

Еталонне значення визначається як характеристика центру розподілу. Значення показника є типовим, якщо воно є одночасно середньої, медианой і модою:

по

Коефіцієнт асиметрії може бути близький до нуля, але не дорівнює йому. Для оцінки значущості відхилення коефіцієнта асиметрії від нульового значення розраховується середня квадратична помилка коефіцієнта асиметрії за формулою

де п - число спостережень.

Якщо виконується співвідношення

то асиметрія вважається статистично незначною. В іншому випадку робиться висновок про наявність значущої асиметрії. На практиці в якості критичного значення приймають As = 0,5, посилюючи тим самим точність висновків. Якщо критичне значення коефіцієнта асиметрії As> 0,5, то сукупність неоднорідна і середнє значення не є типовим.

Якщо коефіцієнт асиметрії негативний, то це означає, що велика частина спостережень має значення показника нижче середнього і мода з медіаною зміщені в бік менших значень в порівнянні з середньою. При позитивній асиметрії спостерігається зворотне співвідношення.

Виходячи з цього, методика визначення еталонного значення показника включає наступні кроки.

  • 1. Для кожного підприємства (організації) за даними бухгалтерської звітності визначається значення досліджуваного показника.
  • 2. Із сукупності видаляються підприємства, що мають негативні значення показника (для показників, розрахунок яких заснований на величинах прибутку / збитку), або мають невизначені значення (немає даних, розподіл на нуль).
  • 3. За що залишилася сукупності даних п розраховуються:

• середнє значення

де х, - значення аналізованого ознаки для i-ro підприємства; п * - кількість підприємств (без віддалених).

Потім розраховується коефіцієнт асиметрії. Середнє квадратичне відхилення визначається за формулою

ш

4. Значення коефіцієнта асиметрії порівнюється з критичним значенням As = 0,5. Якщо фактичне значення коефіцієнта асиметрії по модулю нижче критичного | As | <0,5, то сукупність визнається симетричною щодо середнього значення і в якості еталонного приймається знайдене середнє значення (х *).

при | As | > 0,5 необхідно провести процедуру усунення асиметрії відповідно до п. 1-3.

5. Для всіх значень показника знаходиться величина відхилення індивідуального значення від середнього по сукупності (d,):

)

6. Визначається максимальне абсолютне відхилення d ,:

  • 7. Підприємство, яке має max (d f ), виключається з розглянутої сукупності. Таким чином, загальна кількість спостережень складе (п * -1).
  • 8. Для підприємств, що залишилися повторюються кроки, починаючи з третього пункту. Якщо коефіцієнт асиметрії як і раніше перевищує критичну позначку, то процедура усунення асиметрії і перерахунку коефіцієнта асиметрії повторюється, починаючи з п. 3. Як тільки умова п. 4 виявляється виконаним, процес закінчується.
  • 9. Всі показники ранжуються з точки зору впливу на суму податкових виплат. За значеннями кожного показника визначається зона податкового ризику по віддаленості значень показника від еталонного.

Результатами реалізації процедури виявлення еталонних значень показника є:

  • • вихідні середнє значення (х) і коефіцієнт асиметрії (As);
  • • еталонне значення показника (х е ), а також середньоквадратичне відхилення (а е ) і коефіцієнт асиметрії (As 3 ) для усіченої (еталонної) сукупності, в якій х = х е ;
  • • зведення номерів підприємств, віддалених при проведенні процедури визначення еталонного значення, їх аналіз з причин відсіву - негативні значення показника, невизначені значення показника; максимальне відхилення від середньої;
  • • графік розподілу індивідуальних значень ознаки щодо вихідного середнього значення і графік розподілу індивідуальних значень ознаки щодо еталонного значення.

По завершенні формування еталонних значень показника виконується процедура аналізу варіації індивідуальних значень показника за відхиленнями від еталонного.

Дана процедура ґрунтується на тому положенні, що в нормально розподіленої сукупності ймовірність отримати відхилення індивідуального значення від середнього (в нашому випадку-еталонного) становить

менше 1%. Виділені хвостові значення утворюють зону ризику, тобто це ті підприємства, для яких шанс виїзної податкової перевірки вищий, ніж для підприємств, що тяжіють до центру розподілу.

 
<<   ЗМІСТ   >>