Cum se calculează variația reziduală

Cuprins:

Anonim

Investitorii folosesc modele ale mișcării prețurilor activelor pentru a prezice unde va fi prețul unei investiții la un moment dat. Metodele utilizate pentru a face aceste previziuni fac parte dintr-un câmp în statisticile cunoscute sub numele de regresie. Calculul valorii varianță reziduală a unui set de valori este un instrument de analiză de regresie care măsoară cât de precis se potrivesc predicțiile modelului cu valorile reale.

Linia de regresie

regresie arată modul în care valoarea activului sa modificat datorită modificărilor variabilelor diferite. De asemenea, cunoscut ca a linie de trend, linia de regresie afișează "trendul" prețului activului. Linia de regresie este reprezentată de o ecuație liniară:

Y = a + bx

unde "Y" este valoarea activului, "a" este o constantă, "b" este un multiplicator și "X" este o variabilă legată de valoarea activului.

De exemplu, dacă modelul prezice că o casă cu un dormitor vinde pentru 300.000 de dolari, o casă cu două dormitoare se vinde pentru 400.000 de dolari, iar o casă cu trei dormitoare se vinde pentru 500.000 de dolari, linia de regresie ar arăta astfel:

Y = 200.000 + 100.000X

unde "Y" este prețul de vânzare al casei și "X" este numărul de dormitoare.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

grafică difuzată

A grafică difuzată arată punctele care reprezintă corelațiile reale dintre valoarea activului și variabila. Termenul "scatterplot" provine din faptul că, atunci când aceste puncte sunt reprezentate pe un grafic, ele par a fi "împrăștiate" în jurul lor, în loc să se afle perfect pe linia de regresie. Folosind exemplul de mai sus, am putea avea un scatterplot cu aceste puncte de date:

Punctul 1: 1BR vândut pentru 288.000 $

Punctul 2: 1BR vândut pentru 315.000 $

Punctul 3: 2BR vândut pentru 395.000 $

Punctul 4: 2BR vândut pentru 410.000 $

Punctul 5: 3BR vândut pentru 492.000 dolari

Punctul 6: 3BR vândut pentru 507.000 dolari

Calcularea varianței reziduale

Calculul varianței reziduale începe cu suma patratelor a diferențelor dintre valoarea activului pe linia de regresie și valoarea fiecărui activ corespunzător pe scatterplot.

Pătraturile diferențelor sunt prezentate aici:

Punctul 1: 288.000 dolari - 300.000 dolari = (- 12.000 dolari); (-12000)2 = 144,000,000

Punctul 2: 315.000 dolari - 300.000 dolari = (+ 15.000 dolari); (15,000)2 = 225,000,000

Punctul 3: 395.000 dolari - 400.000 dolari = (- 5.000 dolari); (-5000)2 = 25,000,000

Punctul 4: 410.000 $ - 400.000 $ = (10.000 $); (10000)2 = 100,000,000

Punctul 5: 492.000 $ - 500.000 $ = (- 8.000 $); (-8000)2 = 64,000,000

Punctul 6: 507.000 $ - 500.000 $ = (+ 7.000 $); (7,000)2 = 49,000,000

Suma pătratelor = 607.000.000

Varianța reziduală se găsește luând suma pătratelor și împărțind-o cu (n-2), unde "n" este numărul de puncte de date de pe scatterplot.

RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.

Utilizează variația reziduală

În timp ce fiecare punct de pe scatterplot nu se va alinia perfect cu linia de regresie, un model stabil va avea punctele scatterplot într-o distribuție regulată în jurul liniei de regresie. Varianța varianta este, de asemenea, cunoscută sub numele de "varianță de eroare". O variație reziduală ridicată arată că linia de regresie din modelul original poate fi eronată. Unele funcții de foi de calcul pot arăta procesul din spatele creării unei linii de regresie care se potrivește mai aproape de datele scatterplot.