Повна версія

Головна arrow Економіка arrow ЕКОНОМЕТРИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

ГЕОМЕТРИЧНА ІНТЕРПРЕТАЦІЯ РЕГРЕСІЇ І КОЕФІЦІЄНТА ДЕТЕРМІНАЦІЇ

Розглянемо геометричну інтерпретацію регресії. Припустимо, що ми маємо п -3 спостереження: у, У 2 , уз - залежною змінною Y і х, Х 2 , х 3 1 - пояснює змінної X. Розглядаючи тривимірний простір з осями координат /, 2, 3 , можна побудувати вектори У = (у, у 2 , Уз)> х = (х> х 2 > х з), а також вектор 5 = (1; 1; 1) (рис. 3.7). Тоді значення У, у 2 , Уз, одержувані за рівнянням регресії y = b 0+ biX, можна розглядати як

компоненти вектора У , що представляє собою лінійну комбінацію векторів S і X, т. е. У = b 0 S + biX .

Необхідно знайти такі значення оцінок Ь, при яких вектор У найкращим чином апроксимує (замінює) вектор У тобто вектор залишків е = у ^,? з)> де е, = у, - - у, (/ '= 1, 2, 3) буде мати мінімальну довжину. Очевидно, рішенням завдання буде такий вектор У, для якого вектор е перпендикулярний площині л, утвореною векторами X і S (рис. 3.7), а значить, перпендикулярний і самим векторах ^ і 5, тобто е 1 X і е 1 S.

1 Вважаємо, що рівність Х 1 = Х 2 = Хз не виконується.

Умовою паралельності пари векторів є рівність нулю їх скалярного твори (13.27):

(де д = 3), т. е. ми отримаємо ті ж умови, з яких знаходяться «найкращі» оцінки /> о, Ь (див. (3.13), (3.11)) методу найменших квадратів.

Мал. 3.7

Вектор ЗР є ортогональна проекція вектора Y на вектор S. З векторної алгебри відомо, що довжина такого вектора дорівнює відношенню скалярного твори векторів Y і S до довжини вектора 5, т. Е.

де у - середнє значення змінної Y.

Отже, вектор ВР = yS .

Вектор Y є ортогональна проекція вектора У на площину л. За відомою в стереометрії теореми про три перпендикуляри

проекція вектора Y на вектор S збігається з ОР. Отже, прямокутний трикутник PMN утворюють вектори PM = Y - yS,

PN = Y - yS, NM = Y ~ Y = е (див. Рис. 3.7). По теоремі Піфагора

| / W | = | / W | + | Л (Л / | 2 , де вертикальними рисами відзначені довжини векторів. Це рівність відповідає розкладанню (3.41) загальної суми Q квадратів відхилень залежної змінної Y від середньої у на суму квадратів Qr, обумовлену регресією, і залишкову суму квадратів Q e , т . е. Q = Qr + Q e . Тому коефіцієнт детермінації R 2 , що визначається за (3.47), набуде вигляду:

де ф - кут між векторами PN і РМ.

Геометрична інтерпретація регресії, яку провели за п = 3 спостереженнях, в принципі зберігається і при п> 3, однак при цьому вона втрачає свою наочність.

 
<<   ЗМІСТ   >>