Powrót do Prognozowanie

Współczynnik Theila

Kolejnym często wykorzystywanym współczynnikiem do określenia jakości modelu prognostycznego jest ,,Współczynnik Theila”. Współczynnik Theila służy do obliczenia całkowitego względnego błędu prognozy w okresie testowania. Wyraża się go wzorem:

theil1

Podobnie jak w przypadku RMSE. Im mniejsza wartość współczynnika, tym wyższa jakość modelu, wartość zerową otrzymujemy dla prognoz idealnie trafnych. Im wartość współczynnika Theila jest większa, tym wyższe są różnice między prognozami a wartościami zmiennej prognozowanej. Cechą szczególną współczynnika Theila jest możliwość jego rozkładu na sumę trzech składników, które pozwalają na ocenę źródła błędu predykcji.

theil2

Gdzie poszczególne elementy wyrażamy wzorem:

1.)

theil_i1

 

Współczynnik ten odzwierciedla obciążenie predykcji, czyli to, w jakim stopniu nie udało się odgadnąć średniej wartości zmiennej prognozowanej.

2.)

theil_i2

Określa, w jakim stopniu zmienność prognozy i zmiennej prognozowanej są do siebie zbliżone. Składnik ten ma związek z precyzją prognozowania.

3.)

theil_i3

 

Składnik ten informuje czy wystąpiła zgodność kierunków zmian prognoz z rzeczywistym kierunkiem zmian prognozowanej. Nieodgadnięcie kierunku tendencji w szeregu świadczy o słabej przydatności modelu do odzwierciedlenia tych tendencji.

Podczas obliczania wybieramy zazwyczaj model o najwyższym zróżnicowaniu składników. Pokaże to na przykładzie. Wykorzystałem program, który napisałem do obliczania współczynnika Theila. Wprowadziłem dane i otrzymałem współczynniki takie jak na obrazku poniżej:

theil3

 

Dane wprowadziłem po lewej stronie, była to prognoza osiągnięta za pomocą modelu Holta(model 2). Jak widzimy, program sam oblicza współczynnik Theila jego składowe razem z procentami. Skorzystałem z metody Browna i wybrałem takie alfa, aby współczynnik Theila był podobny, to są współczynniki, jakie otrzymałem(model 1):

theil5

Jak widzimy, oba modele różnią się głównie wartościami I1 i I2 oznacza to, że model 1 ma mniejsze odchylenia średniej wartości prognozowanej od średniej wartości empirycznej, to znaczy, że średnia wartość błędu jest dla modelu 1 dużo mniejsza niż dla modelu 2. I2 świadczy o tym, jak duże są różnice między zmiennością prognozowaną i prognozą, czyli jak duża jest różnica między jedną zmiennością a drugą, wskaźnik ten świadczy o precyzji prognozowania. Czyli mimo tego, że różnice w błędzie były większe dla modelu drugiego, jego zmienność była bardziej zbliżona, co świadczy o większej precyzji prognozy ex-post a w rezultacie i prognozy ex-ante. Moim zdaniem lepszy jest model 2. Jeśli któreś z udziałów było by nieprzeciętnie wysokie tzn: stanowiło by 99% albo nieprzeciętnie niska 0% to rozkład taki świadczy o słabym dostosowaniu modelu i powinien być odrzucany w pierwszej kolejności. Mam nadzieje, że udało mi się coś wytłumaczyć, jeśli nie spróbujcie spojrzeć jeszcze raz na wzory dla I1, I2, I3 i ocenić skąd biorą się ich wartości i jak je interpretować. Jeśli wam się przyda, możecie pobrać program do obliczania współczynnika Theila i jego dekompozycji.

wspolczynnik_theila

 

Program pobieramy tutaj:

Wspolczynnik_Theila

 

 

 

Permalink do tego artykułu: https://visualmonsters.cba.pl/prognozowanie/wspolczynnik-theila/

Dodaj komentarz

Twój adres email nie będzie publikowany.