Prognozowanie ekonometrycznePrognozowanie i symulacjeStrona główna | Ekonometria | Statystyka | Prognozowanie i symulacje | Formularz kontaktowy
|
Predykcja na podstawie modelu przyczynowo-skutkowego
Taki sposób przeprowadzenia procesu predykcji dosłużył się miana "klasyczny". Jest to - z punktu widzenia teorii i praktyki prognozowania ekonometrycznego - najbardziej pożądany tryb wnioskowania w przyszłość. Predykcja na podstawie opisowych modeli przyczynowo-skutkowych nabiera szczególnego znaczenia wtedy, gdy występuje strukturalna zmienność analizowanego procesu gospodarczego i/lub nie można wyodrębnić stałej tendencji rozwojowej zmiennej objaśnianej-prognozowanej. Wspomniana niemożność oznacza, że nie dysponujemy stosownym modelem opisującym wewnętrzną dynamikę zmiennej prognozowanej, a może wynikać z trzech przyczyn:
· zmienna prognozowana jest od dawna obserwowana "jakościowo", ale nie mamy odpowiednich narzędzi do ilościowego jej określenia, a zatem nie dysponujemy niezbędnymi liczbowymi danymi statystycznymi, aby zbudować odpowiedni model tendencji rozwojowej;
· zmienna prognozowana jest od dawna obserwowana "ilościowo" (jest dostępny odpowiedni zbiór liczbowych danych statystycznych), ale nie sposób dobrać jakiejkolwiek "sensownej" postaci analitycznej dla aproksymacji jej zachowania w czasie (np. zmienna prognozowana podlega jakimś nierozpoznanym fluktuacjom i zmienia się gwałtownie);
· zmienna prognozowana jest koncepcyjnie czymś nowym, funkcjonującym od niedawna w teorii i praktyce, i - nawet wtedy, gdy potrafimy ją mierzyć - materiał statystyczny jest zbyt skąpy, aby można było postawić jakiekolwiek hipotezy o wzorcu jej zachowania w czasie.
Predykcja na podstawie modelu kazualnego jest szczególnie pożądana w okresach przełomowych, np. podczas gwałtownych zmian koniunktury gospodarczej, czy nawet w trakcie transformacji systemu socjo-ekonomicznego. Ale - jak zwykle: "coś za coś". Musimy bowiem dysponować sprawdzonym w przeszłości, solidnym przyczynowo-skutkowym modelem ekonometrycznym, który spełnia wszystkie warunki składające się na pomyślne "przejście" weryfikacji strukturalno-stochastycznej, oraz wykazuje wysoką wartość współczynnika korelacji wielorakiej, R ³ 0,9. Zespół zmiennych objaśniających musi niemal w pełni stanowić przyczyny skutku, czyli zmienności zmiennej prognozowanej. Jeżeli na wejściu do procesu predykcji mamy taki właśnie predykat, to na wyjściu tegoż procesu możemy oczekiwać (ale nigdy być pewni!) na trafne prognozy o dowolnym horyzoncie czasowym (krótko-, średnio- lub długookresowym[1]). Pamiętajmy zawsze o tych, którzy "chcą wiedzieć więcej"; predykcja na podstawie przyczynowo-skutkowego modelu ekonometrycznego może realizować cele wyłącznie poznawcze, czyli teoretyczne. I wtedy niezbyt skomplikowany proces obliczeniowy przyczyni się do lepszego poznania mechanizmu rozwojowego zmiennej prognozowanej.
Predykcja na podstawie liniowego modelu przyczynowo-skutkowego (przykład)
Przyjmujemy następujące oznaczenia:
yt – (zmienna objaśniana, „skutek”) wielkość produkcji wyrobu w roku t (w tys. naturalnych jednostek miary),
x1t – (zmienna objaśniająca, „przyczyna 1”) przeciętna liczba zatrudnionych w roku t (w tys. osób),
x2t - (zmienna objaśniająca, „przyczyna 2”) przeciętna wartość majątku produkcyjnego w roku t (w mln zł),
ut – wartość składnika losowego modelu w roku t,
n - liczba obserwacji (lata, n = 7),
t - numer obserwacji (indeks roku, t = 1, 2, ..., n).
Przyjmujemy liniową postać analityczną modelu:
yt = a0 + a1· x1t + a2· x2t + ut
gdzie:
a0, a1 i a2 – parametry strukturalne modelu.
Niech następne symbole oznaczają:
a0, a1 i a2 – oceny (estymatory) parametrów strukturalnych modelu,
- średnia arytmetyczna z próby obliczona dla zmiennej y,
- teoretyczna wartość zmiennej y w roku t, obliczna wg wzoru:
= a0 + a1· x1t + a2· x2t
Poniższa tabela zawiera dane próby statystycznej. Trzy ostatnie kolumny tej tabeli zawierają – dla zmiennej y: obliczone wartości teoretyczne, kwadraty odchyleń wartości empirycznych i teoretycznych oraz kwadraty różnic wartości empirycznych i średniej arytmetycznej. Oczywiście, obliczenia te możemy przeprowadzić dopiero po uzyskaniu ocen parametrów strukturalnych modelu.
[1] To, czy horyzont czasowy prognozy nazwiemy krótkim, średnim lub długim zależy od dwóch czynników, a mianowicie od:
· oddalenia w przyszłość stawianej prognozy (to oczywiste!) i
· poziomu uogólnienia, na którym znajduje się zjawisko prognozowane (np. przedsiębiorstwo, grupa przedsiębiorstw, branża, pojedynczy człowiek, gospodarstwo domowe, wspólnota mieszkaniowa, osiedle, miasto, gmina, powiat, kraj, grupy krajów, kontynent, świat).
Przy ustalonym oddaleniu w przyszłość, zwiększający się poziom uogólnienia zmniejsza horyzont czasowy prognozy, i na odwrót. Przy ustalonym poziomie uogólnienia, zwiększające się oddalenie w czasie zwiększa horyzont czasowy prognozy. Dla przykładu, prognoza poziomu kosztów produkcji pojedynczego przedsiębiorstwa będzie (mniej więcej):
· do trzech lat - prognozą krótkookresową,
· do pięciu, sześciu lat - prognozą średniookresową,
· do dziesięciu lat - prognozą długookresową.
A oceny te obliczamy, stosując znaną z kursu ekonometrii procedurę macierzową.
|
|
7,00 |
35,00 |
120,00 |
|
xTx = |
|
35,00 |
179,96 |
616,20 |
|
|
|
120,00 |
616,20 |
2121,50 |
|
Det(xTx) = 397,4
|
|
686,00 |
|
xTy = |
|
3485,35 |
|
|
|
11960,80 |
|
|
|
5,2408 |
-0,7763 |
-0,0710 |
|
(xTx)-1 = |
|
-0,7763 |
1,1336 |
-0,2854 |
|
|
|
-0,0710 |
-0,2854 |
0,0874 |
|
|
|
40,7830 |
|
a = |
|
5,4465 |
|
|
|
1,7491 |
|
|
|
15,1695 |
-2,2470 |
-0,2054 |
|
D2(a) = |
|
-2,2470 |
3,2812 |
-0,8260 |
|
|
|
-0,2054 |
-0,8260 |
0,2529 |
|
|
|
3,8948 |
|
D(a) = |
|
1,8114 |
|
|
|
0,5029 |
|
yt = |
40,7830 |
+ |
5,4465 x1t |
+ |
1,7491 x2t |
+ |
ut |
|
(3,8948) |
|
(1,8114) |
|
(0,5029) |
|
(1,7013) |
= 98,0 (średnia arytmetyczna zmiennej objaśnianej, liczona z próby statystycznej)
S2 = 2,8945 (ocena wariancji składnika losowego)
S = 1,7013 (ocena odchylenia standardowego składnika losowego)
VS = 1,74% (współczynnik zmienności losowej)
j2 = 0,0174 (współczynnik zbieżności)
R2 = 0,9826 (współczynnik determinacji)
R = 0,9912 (współczynnik korelacji wielokrotnej)
Przeglądając oceny parametrów strukturalnych i parametrów stochastycznych stwierdzamy, że model bardzo dobrze opisuje badany związek przyczynowo-skutkowy i uzasadnione jest przypuszczenie, że będzie on dobrym predyktorem w ekonometrycznym prognozowaniu wartości zmiennej y. Na tym kończy się etap modelowania ekonometrycznego, teraz przejdziemy do wnioskowania w przyszłość.
1o. Należy wyznaczyć prognozę punktową wielkości produkcji na rok 2000 () wiedząc - na podstawie planu średnioterminowego - że:
x1*(2000) = 8,0 tys. osób - planowane zatrudnienie,
x2*(2000) = 25,0 mln zł - planowana wartość majątku produkcyjnego.
Odpowiedź:
= 40,7830*1 + 5,4465*8 + 1,7491*25 = 128,0824 (tys. NJM)
Taki sam wynik otrzymamy, gdy zastosujemy obliczenie macierzowe. Otóż, do celu prowadzi nas następujący wzór macierzowy:
gdzie:
- trzyelementowy wektor kolumnowy planowanych (na 2000 rok) wartości zmiennych objaśniających; pierwszy element (1) jest stałą wartością pseudozmiennej (X0) stojącej przy parametrze wolnym
a - trzyelementowy wektor kolumnowy ocen parametrów strukturalnych modelu
2o. Ocenić dokładność powyższej prognozy punktowej, obliczając:
a) wariancję predykcji
b) błąd średni predykcji
c) błąd prognozy - przy założeniu, że zrealizowana wielkość produkcji w 2000 roku wyniosła 150,0 tys. NJM.
Ad. 2oa
Oznaczenia:
k - liczba szacowanych parametrów strukturalnych,
r, s - indeksy szacowanych parametrów strukturalnych <1..k>,
xrT, xsT - założone (planowane) wartości zmiennych objaśniających w okresie prognozowanym,
D2(ar) - wariancja estymatora ar,
cov(ar, as) - kowariancja estymatorów ar i as,
- wariancja składnika losowego w okresie prognozowanym (przyjmuje się, że = S2).
Aby obliczyć wariancję predykcji, niezbędne są: założone wartości zmiennych objaśniających, macierz wariancji i kowariancji oraz ocena wariancji składnika losowego.
Odpowiedź:
V2 = |
12*15,1695 + 82*3,2812 + 252*0,2529 + |
|
2*[1*8*(-2,2470) + 1*25*(-0,2054) + 8*25*(-0,8260)] + |
|
2,8945 |
= |
9,5130 |
Wzór macierzowo-skalarny:
daje taki sam wynik
Wariancja predykcji, jak każda wariancja, nie ma interpretacji ekonomicznej; choćby dlatego, że w naszym przykładzie V2 jest mianowane "NJM2".
Ad. 2ob
Błąd średni predykcji (V) liczymy ze wzoru
gdyż błąd ten gra rolę odchylenia standardowego (przewidywanego) wartości prognozowanej od nieznanej, przyszłej wartości zmiennej y.
Odpowiedź:
V = 3,0843 (tys. NJM)
Interpretacja: przeciętnie biorąc, rzeczywista wartość zmiennej prognozowanej będzie się odchylać od wyznaczonej prognozy o ±3,0843 NJM. Czy ta predykcja jest efektywna? Czy – po prostu – obliczony błąd prognozy jest duży, czy mały? Z kursu statystyki wiemy, że odchylenie standardowe jest jednym z wielu bezwzględnym miernikiem zmienności. Dopiero odniesienie błędu predykcji do jakiejś podstawy (konkretnie – do prognozy punktowej) da nam względny miernik błędu. Zapiszmy zatem wzór:
a podstawiając do wzoru znane wartości V i , otrzymujemy
V% = (3,0843 / 128,0824) * 100% = 2,41%
Oczywiście, tym lepiej dla efektywności prognozy, im mniejsza jest bezwzględna wartość V% (zawsze jednak większa od zera). Krytyczna wartość V%kryt = 15%, co oznacza, że jeśli obliczona bezwzględna wartość V% przekracza 15%, to w ogóle nie ma mowy o predykcji efektywnej. Sam model ekonometryczny nie może być predyktorem.
Ad. 2oc
Błąd prognozy (Q) jest miernikiem ex post i możemy go obliczyć wtedy, gdy znamy rzeczywistą, czyli zaobserwowaną wartość zmiennej prognozowanej (tutaj - na koniec 2000 roku). Miernik ten jest mianowany tak samo jak zmienna prognozowana a liczymy go ze wzoru:
Określa on po prostu różnicę pomiędzy rzeczywistą wartością zmiennej prognozowanej a wartością jej prognozy w okresie T.
Odpowiedź:
Q = 150,0 - 128,0824 = 21,9176 (tys. NJM)
Kłopot z "wyceną" miernika Q wynika z tego, że jest on mianowany (gdyż jest miernikiem bezwzględnym, tak samo jak np. rozstęp empiryczny, Re) a polega na tym, że czytanie wyizolowanej liczby 21,9176 tys. NJM nie zbliża nas do odpowiedzi na pytania w rodzaju: "Czy te prawie 22 tys. NJM to mało. czy dużo?" i "Czy prognoza była trafna, czy też chybiona?"
Każdy bezwzględny miernik odchylenia (lub zmienności) można wykorzystać do obliczenia odpowiadającego mu miernika względnego, czyli niemianowanego - zwykle wyrażanego w procentach. Wystarczy ustalić co jest podstawą - jednością, czyli 100%. W przypadku błędu prognozy nie może być inaczej - podstawą jest prognozowana wartość zmiennej y, czyli 128,0824 NJM. Jeżeli błąd prognozy podzielimy przez tę podstawę, a iloraz pomnożymy przez 100%, to otrzymamy względny miernik określający procentowy błąd prognozy. I tak:
a podstawiając do wzoru znane wartości Q i , otrzymujemy
Q% = (21,9176 / 128,0824) * 100% = 17,11%
Oczywiście, tym lepiej dla trafności prognozy, im mniejsza jest bezwzględna wartość Q% (ideałem jest Q = 0 i Q% = 0%). Krytyczna wartość Q%kryt = 15%, co oznacza, że jeśli obliczona bezwzględna wartość Q% przekracza 15%, to należy sprawdzić, czy spełnione są podstawowe warunki dla przeprowadzania predykcji ekonometrycznej. Sam model ekonometryczny mógł być przez lata stosowany jako predyktor i pozwalał na uzyskiwanie trafnych prognoz punktowych. Mogły - po prostu - w "otoczeniu" modelu zajść okoliczności przeczące założeniom predykcji ekonometrycznej (patrz: wykład PiS-01).
3o. Wyznaczyć prognozę przedziałową wielkości produkcji dla lat 1998, 1999 i 2000, wiedząc, że:
Rok 1998 |
T = 8 |
|
Rok 1999 |
T = 9 |
|
Rok 2000 |
T = 10 |
||||||||||||||
|
|
1 |
|
|
|
|
1 |
|
|
|
|
1 |
|
|
|||||||
x* = |
|
7 |
|
|
x* = |
|
7 |
|
|
x* = |
|
8 |
|
|
|||||||
|
|
22 |
|
|
|
|
23 |
|
|
|
|
25 |
|
|
|||||||
Przy założeniu, że składnik losowy predyktora jest zmienną losową o rozkładzie normalnym (o zerowej wartości oczekiwanej i odchyleniu standardowym równym s), prognozę przedziałową ustalamy według formuły:
... którą czytamy następująco: prawdopodobieństwo (P) tego, że rzeczywista wartość zmiennej prognozowanej () znajdzie się w wyznaczonym przedziale prognozy (o rozpiętości 2*ta*VT) wynosi 1-a.
gdzie:
- prognoza punktowa zmiennej prognozowanej,
- rzeczywista wartość zmiennej prognozowanej,
VT = V - błąd predykcji punktowej,
a - przyjęty poziom istotności - mała dodatnia liczba rzeczywista (najczęściej 0,05),
1-a - przyjęty poziom ufności (najczęściej 0,95),
ta - wartość zmiennej losowej o rozkładzie t-Studenta dla poziomu istotności a i dla n-k stopni swobody.
Krok 1. Prognoza punktowa
Rok |
T |
|
VT |
1998 |
8 |
117,3886 |
2,5203 |
1999 |
9 |
119,1377 |
2,3995 |
2000 |
10 |
128,0824 |
3,0843 |
Przyjmijmy zatem, że wymagamy wysokiego poziomu istotności, a = 0,05, czyli prognozowany przedział wartości zmiennej y chcemy określić z prawdopodobieństwem (z poziomem ufności) równym 0,95. Jeżeli chodzi o drugi parametr, niezbędny dla wyznaczenia wartości zmiennej o rozkładzie t-Studenta (ta), to liczba stopni swobody jest zadana - od liczby obserwacji odejmujemy liczbę szacowanych parametrów strukturalnych modelu ), n-k = 7 - 3 = 4. Z tablicy statystycznej odczytujemy (na przecięciu odpowiedniego wiersza i odpowiedniej kolumny): ta = 2,776.
Krok 2. Prognoza przedziałowa
Rok |
T |
Przedział ufności |
1-a |
1998 |
8 |
P{110,3922 < y8 < 124,3850} |
= 0,95 |
1999 |
9 |
P{112,4767 < y9 < 125,7987} |
= 0,95 |
2000 |
10 |
P{119,5204 < y10 < 136,6444} |
= 0,95 |
Wyjaśnienia:
117,3886 - 2,776 * 2,5203 = 110,3922;
117,3886 + 2,776 * 2,5203 = 124,3850.
Interpretacja prognoz przedziałowych - z prawdopodobieństwem 0,95 wartość zmiennej y znajdzie się w przedziale:
Mapa strony ekonometria.4me.pl
Copyright © ekonometria.4me.pl 2005-2013. Wszelkie prawa zastrzeżone. Zabrania się kopiowania, redystrybucji, publikacji lub modyfikacji jakichkolwiek materiałów zawartych na stronie internetowej , bez wcześniejszej pisemnej zgody autorów.
Prognozowanie ekonometryczne