Повна версія

Головна arrow Економіка arrow ЕКОНОМЕТРИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

ОЦІНКА ПАРАМЕТРІВ КЛАСИЧНОЇ РЕГРЕСІЙНОЇ МОДЕЛІ МЕТОДОМ НАЙМЕНШИХ КВАДРАТІВ

Для оцінки вектора невідомих параметрів р застосуємо метод найменших квадратів. Так як твір транспонованою матриці е ' на саму матрицю е

1 Знаком « '» позначається операція транспонування матриць.

то умова мінімізації залишкової суми квадратів запишеться у вигляді:

З огляду на, що при транспонировании твори матриць виходить твір транспонованих матриць, взятих в зворотному порядку, тобто (Хь) '= Ь'Х після розкриття дужок отримаємо:

Твір Y'Xb є матриця розміру (1хл) [лх (р + 1)] х х [(/ Н "1) х 1] = (1x1), тобто величина скалярна, отже, воно не змінюється при транспонировании, тобто Y'Xb = (Y'Xb) '= b'X' Y Тому умова мінімізації (4.3) набуде вигляду:

На підставі необхідної умови екстремуму функції кількох змінних 5 (6о, Ь р ), що представляє (4.3),

необхідно прирівняти нулю приватні похідні по цим змінним або в матричної формі - вектор приватних похідних

Для вектора приватних похідних доведені наступні формули (§ 13.10):

де b і з - вектор-стовпці; А - симетрична матриця, в якій елементи, розташовані симетрично щодо головної діагоналі, дорівнюють.

1

Тому, вважаючи з = X'Y , а матрицю Л = Х'Х (вона є симетричною - см. (4.6)), знайдемо

звідки отримуємо систему нормальних рівнянь в матричної формі для визначення вектора b :

Знайдемо матриці, що входять в це рівняння * 1 * . Матриця Х'Х представляє матрицю сум перших ступенів, квадратів і попарних творів п спостережень пояснюють змінних:

п спостережень

Матриця X 'Y є вектор творів пояснюють і залежною змінних:

В окремому випадку з розглянутого матричного рівняння (4.5) з урахуванням (4.6) і (4.7) для однієї пояснює змінної (/? =!) Неважко отримати вже розглянуту вище [1] [2]

систему нормальних рівнянь (3.5). Дійсно, в цьому випадку матричне рівняння (4.5) приймає вид:

звідки безпосередньо випливає система нормальних рівнянь (3.5).

Для вирішення матричного рівняння (4.5) щодо вектора оцінок параметрів b необхідно ввести ще одну передумову 6 (див. С. 72) для множинного регресійного аналізу: матриця X'X є неособенной , т. Е. Її визначник не дорівнює нулю. Отже, ранг матриці Х'Х дорівнює її порядку, тобто r (X'X) = p + 1. З матричної алгебри відомо (див. § 13.4), що г (Х'Х) = г (Х), значить, г (Х) = р +, т. е. ранг матриці плану X дорівнює числу її стовпців. Це дозволяє сформулювати передумову 6 множинного регресійного аналізу в наступному вигляді:

6. Вектори значень пояснюють змінних , або стовпці матриці плану X, повинні бути лінійно незалежними , т. Е. Ранг матриці X - максимальний (г (Х) = р + 1).

Крім того, вважають, що число наявних спостережень (значень) кожної з пояснюють і залежною змінних перевершує ранг матриці X , т. Е. N> r (X) або п> р + 1, тому що в протилежному випадку в принципі неможливо отримання скільки- небудь надійних статистичних висновків.

Нижче, в § 4.3, розглядається ковариационная матриця вектора збурень Y, з > є багатовимірним аналогом дисперсії однієї змінної. Тому в нових термінах [3] наведені раніше (с. 72, 93 і тут) передумови для множинного регресійного аналізу можуть бути записані таким чином [4] :

  • 1. У моделі (4.2) е - випадковий вектор, X - невипадкова (детермінована) матриця.
  • 2. М (s) = 0 ".
  • 3,4. ^ * = М (ег ') = о [4] Е ".
  • 5. 8 - нормально розподілений випадковий вектор, т.с. е ~ Л ', (0; а =? ").
  • 6. г (Х) = р + <п.

Як уже відзначено в § 4.1, модель (4.2), що задовольняє наведеним передумов / ~ 6, називається класичної нормальної лінійної моделлю множинної регресії ; якщо ж серед наведених не виконується лише передумова 5 про нормальному законі розподілу вектора збурень s, то модель (4.2) називається просто класичної лінійної моделлю множинної регресії.

Рішенням рівняння (4.5) є вектор

де (Х'Х) ~ х - матриця , зворотна матриці коефіцієнтів системи (4.5), XY - матриця-стовпець, або вектор , її вільних членів.

Теорема Гаусса-Маркова, розглянута вище для парної регресійної моделі, виявляється вірною і в загальному вигляді для моделі (4.2) множинної регресії:

При виконанні передумов 1 множинного регресійного аналізу оцінка методу найменших квадратів b = (X'X) ~ [ X'Yявляется найбільш ефективною , т. Е. Має найменшу дисперсією в класі лінійних незміщених оцінок (Best Linear Unbiased Estimator , або BLUE) [6] [7] .

Знаючи вектор />, вибіркове рівняння множинної регресії представимо у вигляді:

де у - групова (умовна) середня змінної Y при заданому векторі значень пояснює змінної

Х 0 = ( Х | 0 х 2 про ... х р о).

? Приклад 4.1. Є такі дані [8] (умовні) про змінною видобутку вугілля на одного робочого Y (т), потужності пласта

Х (м) і рівні механізації робіт Xi (%), що характеризують процес видобутку вугілля в 10 шахтах.

Таблиця 4.1

/

* / 1

ха

У, '

/

* л

ха

3V

1

8

5

5

6

8

8

6

2

11

8

10

7

9

6

6

3

12

8

10

8

9

4

5

4

9

5

7

9

8

5

6

5

8

7

5

10

12

7

8

Припускаючи, що між змінними Т, Х і Xi існує лінійна кореляційна залежність, знайти її аналітичний вираз (рівняння регресії Y по Х і Лу.

Рішення. позначимо

(нагадуємо, що в матрицю плану X вводиться додатковий стовпець чисел, що складається з одиниць).

Для зручності обчислень складаємо допоміжну таблицю.

Таблиця 4.2

/

* / 1

ха

3V

4

y-2

х а

про

УГ

ХЦ ха

JVX / l

У * а

У,

1

S

II

1

8

5

5

64

25

25

40

40

25

5,13

0,016

2

11

8

10

121

64

100

88

ПО

80

8,79

1.464

3

12

8

10

144

64

100

96

120

80

9.64

1,127

4

9

5

7

81

25

49

45

63

35

5,98

1,038

5

8

7

5

64

49

25

56

40

35

5,86

0,741

6

8

8

6

64

64

36

64

48

48

6,23

0,052

7

9

6

6

81

36

36

54

54

36

6,35

0,121

8

9

4

5

81

16

25

36

45

20

5.61

0,377

9

8

5

6

64

25

36

40

48

30

5,13

0,762

10

12

7

8

144

49

64

84

96

56

9,28

1,631

I

94

63

68

908

417

496

603

664

445

-

6,329

(Див. Суми в підсумковому рядку табл. 4.2);

Матрицю А 1 = (Х'Х) 1 визначимо за формулою А ~ 1 = т-га,

А

де А - визначник матриці X'X; А - матриця,

приєднана до матриці X X. Отримаємо

(Рекомендуємо читачеві переконатися в цьому самостійно).

Тепер відповідно до (4.8) примножуючи цю матрицю на вектор

(^ -13230Т (-3,5393 '

отримаємо Ь = -! - 3192 = 0,8539

3738

^ 312) { 0,3670 )

З урахуванням (4.9) рівняння множинної регресії має вигляд: у = -3,54 + 0,854х [+ 0,367 ^ 2 Воно показує, що при збільшенні тільки потужності пласта Х (при незмінному Xj) на 1 м видобуток вугілля на одного робітника Y збільшується в середньому на 0,854 т, а при збільшенні тільки рівня механізації робіт Х 2 (при незмінній Х) - в середньому на 0,367 т.

Додавання в регресійну модель нової пояснює змінної Xi змінило коефіцієнт регресії Ь (К по Х) з 1,016 для парної регресії (див. Приклад 3.1) до 0,854 - для множинної регресії. В цьому ніякого протиріччя немає, так як в другому випадку коефіцієнт регресії дозволяє оцінити приріст залежною змінною Y при зміні на одиницю пояснює змінної Х в чистому вигляді, незалежно від Х 2 - У випадку парної регресії Ь враховує вплив на Y не тільки змінної Х 9 але і побічно кореляційно пов'язаної з нею змінної Х ^. ?

На практиці часто буває необхідно порівняння впливу на залежну змінну різних пояснюють змінних, коли останні виражаються різними одиницями виміру. У цьому випадку використовують стандартизовані коефіцієнти регресії bj і коефіцієнти еластичності Ej (J = 1,2, ..., р):

Стандартизований коефіцієнт регресії b ' показує , на скільки величин s y зміниться в середньому залежна змінна Y при збільшенні тільки jпояснює змінної на s x , а

коефіцієнт еластичності Ej - на скільки відсотків (від середньої) зміниться в середньому Y при збільшенні тільки Xj на 1%.

? Приклад 4.2.

За даними прикладу 4.1 порівняти роздільне вплив на змінну видобуток вугілля двох факторів - потужності пласта і рівня механізації робіт.

Рішення. Для порівняння впливу кожної з пояснюють змінних за формулою (4.10) обчислимо стандартизовані коефіцієнти регресії:

Е х = 0,8539 • ^ = 1,180; Е, = 0,3670 • ^ = 0,340.

  • 6,8 6,8
  • (Тут ми опустили розрахунок необхідних характеристик змінних:

Таким чином, збільшення потужності пласта і рівня механізації робіт тільки на одне s Xl або на одне s X2 збільшує в середньому змінне видобуток вугілля на одного робітника відповідно на 0,728s y або на 0,285 ^, а збільшення цих змінних на 1% (від своїх середніх значень) призводить в середньому до зростання видобутку вугілля відповідно на 1,18% і 0,34%. Отже, за обома показниками на змінну видобуток вугілля більший вплив робить фактор «потужність пласта» у порівнянні з фактором «рівень механізації робіт». ?

Перетворимо вектор оцінок (4.8) з урахуванням (4.2):

або

тобто оцінки параметрів (4.8), знайдені за вибіркою, будуть містити випадкові помилки.

Так як математичне очікування оцінки b дорівнює оцінюваному параметру р, т. Е.

бо в силу (3.23) Л / (е) = 0, то, очевидно, що вектор b є несмещенная оцінка параметра р.

  • [1] п
  • [2] Тут під знаком X мається на увазі?.
  • [3] 2 Якщо йдеться про одну пояснює змінної відпадає необхідність в запісіпод символом д: другого індексу, що вказує номер змінної.
  • [4] При першому читанні цей матеріал може бути опущений. Е "- одинична матриця / 7-го порядку; 0 "- нульовий вектор розміру п.
  • [5] При першому читанні цей матеріал може бути опущений. Е "- одинична матриця / 7-го порядку; 0 "- нульовий вектор розміру п.
  • [6] Нс включаючи передумову 5 - вимога нормальності закону распределеніявектора збурень е, яка в теоремі Гаусса-Маркова не потрібно.
  • [7] Доказ теореми наведено в § 4.4.
  • [8] У цьому прикладі використані дані прикладу 3.1 з додаванням результатовнаблюденій над новою пояснює змінної Х2, при цьому стару змінну X з прикладу 3.1 позначаємо тепер Х.
 
<<   ЗМІСТ   >>