SAS Statistical Analysis System Eine erste anwendungsorientierte Einf ¨ uhrung f ¨ ur ¨ Okonometriker Datum dieser Version: 5. Dezember 2002 Dipl.-Volksw. Marco Caliendo Dipl.-Volksw. Dubravko Radi´ c Dipl.-Volksw. Stephan L. Thomsen Lehrstuhl f ¨ ur Statistik und ¨ Okonometrie (Empirische Wirtschaftsforschung) Johann Wolfgang Goethe-Universit ¨ at Frankfurt/M.
69
Embed
Statistical Analysis System - wiwi.uni-frankfurt.de · SAS Statistical Analysis System Eine erste anwendungsorientierte ... Susan, J. Slaughter: The little SAS Book - A primer, SAS
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
SAS
Statistical Analysis System
Eine erste anwendungsorientierte
Einfuhrung fur OkonometrikerDatum dieser Version: 5. Dezember 2002
Dipl.-Volksw. Marco CaliendoDipl.-Volksw. Dubravko RadicDipl.-Volksw. Stephan L. ThomsenLehrstuhl fur Statistik und Okonometrie
(Empirische Wirtschaftsforschung)
Johann Wolfgang Goethe-Universitat
Frankfurt/M.
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
1. Erzeugen Sie zunachst eine neue umkodierte abhangige Variable BUY 2.
DATA sasdat.kauf;
SET sasdat.kauf_roh;
BUY_2 = 1 - BUY;
RUN;
2. Schatzen Sie nun ein LOGIT-Modell (mit Konstante) fur die Kaufwahrscheinlichkeit
in Abhangigkeit der Variablen SEX und INCOME. Berechnen Sie auch Gutemaße.
Schreiben Sie die Ergebnisse, sowie die berechnete Kaufwahrscheinlichkeit, die Stan-
dardabweichung und den Wert fur in einen neuen Datensatz KAUF OUT.
PROC PROBIT DATA = sasdat.kauf;
CLASS BUY_2;
LOGIT:MODEL BUY_2 = SEX INCOME / d = logistic lackfit;
OUTPUT OUT = sasdat.kauf_out PROB = PROB STD = SA xbeta = xb;
run;
3. Vergleichen Sie die Kaufwahrscheinlichkeiten der Konsumenten 1 und 2.
Stimmen die Wahrscheinlichkeiten mit dem tatsachlichen Kaufverhalten uberein?
Wie wirkt sich eine Einkommenserhohung von 100,- DM auf das Kaufverhalten der
beiden betrachteten Konsumenten aus? (Hinweis: 0,00448041 ist der berechnete
Beta-Parameter aus 2.)
DATA sasdat.kauf_OUT;
SET sasdat.kauf_OUT;
pdf = (exp(xb)/(1+exp(xb))**2);
marg_100 = pdf*0.00448041*100;
LABEL marg_100 = ’marginaler Effekt von 100,-DM’;
RUN;
4. Berechnen Sie als Gutemaß das R2 nach McFadden und Aldrich-Neslon. (-6.0719 ist
der berechnete Wert der Log-Likelihood-Funktion aus 3).
2Aus:”Okonometrie“ von Eckey/Kosfeld/Dreger.
29
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
DATA sasdat.guete;
SET sasdat.kauf;
LL_0=14*log(14/25)+11*log(11/25);
KEEP LL_0;
RUN;
DATA sasdat.guete;
SET sasdat.guete;
R_2MF=1-(-6.0719/LL_0);
R_2AN=(2*(-6.0719/LL_0))/(2*(-6.0719/LL_0)+25);
RUN;
8. Prozedur MODEL
Mit Hilfe der SAS Prozedur MODEL konnen unbekannte Parameter von Mehrgleichungs-
modellen geschatzt werden. Mit den geschatzten Modellen konnen anschließend Simu-
lationen und Prognosen durchgefuhrt werden. Diese kurze Einfuhrung soll den Leser mit
den wichtigsten Befehlen und Eigenschaften dieser Prozedur bekannt machen.
1. Einfuhrung
PROC MODEL; OPTIONS;
RESET OPTIONS;
INCLUDE ...;
ENDOGENOUS variables; Festlegung der Variablen und
EXOGENOUS variables; der Struktur des Modells; Fest-
PARAMETERS ...; legung von allgemeinen Optionen
VAR variables;
FIT EQUATIONS;
INSTRUMENTS ...; Schatzung des Modells (Fit)
WEIGHT variables;
SOLVE variables; Prognose und Simulation (Solve)
BY variables;
ID variables; Kontrolle uber die beobachteten Werte
RANGE variables (=first) TO (=last);
30
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
OUTVARS variables; Festlegung der Variablen im Outputdatensatz
RUN;
In dieser Reihenfolge werden nun die wichtigsten Bestandteile der MODEL Prozedur an-
hand von Beispielen vorgestellt.
2. Festlegung der Variablen und der Struktur des Modells
In einem ersten Schritt werden die Variablen und Paramater, die in dem Modell auftau-
chen, sowie die Gleichungen, die diese miteinander verbinden, definiert.
Dabei kann man entweder explizit angeben, welche der in dem Modell auftauchenden
Variablen endogen (nach dem Befehl Endogenous, abgekurzt Endo) und welche exogen
(nach dem Befehl Exogenous, abgekurzt Exo) sind, oder man gibt, ohne eine Unterschei-
dung zu treffen, alle verwandten Variablen nach dem Befehl Var an und uberlaßt es SAS,
eine Unterscheidung zu treffen. SAS trifft diese Entscheidung gemaß der Rolle, die die Va-
riablen in den Subprozeduren Fit und Solve spielen.
Die getrennte Eingabe dient dabei vor allem der besseren Ubersichtlichkeit und weist SAS
zudem noch an, dass es bei spaterer Verwendung des Solve Befehls das System nach den
endogenen Variablen losen soll.
Nach der Parameters Anweisung (abgekurzt Parms) werden die Paramater des Glei-
chungssystems festgelegt. Hierbei besteht zudem noch die Moglichkeit, den Parametern
bestimmte Werte vorzugeben, indem man den entsprechenden Wert nach dem Para-
meter setzt (z.B. wird mit d1 1 der Parameter d1 auf 1 restringiert, insbesondere um die
Identifikation der Modelle zu gewahrleisten, sind solche Restriktion notwendig).
Im Anschluß werden die Strukturgleichungen des Modells festgelegt. Bei der Eingabe der
Gleichungen stehen zwei Wege zur Verfugung: Eingabe in normalisierter Form oder in
Standardform. Eingabe der Gleichungen in normalisierter Form meint dabei die Einga-
be der Gleichungen aufgelost nach jeweils einer endogenen Variablen: y = f(Y, X) + ε.
Eingabe in Standardform meint die Eingabe jeweils aufgelost nach der Storvariable: ε =g(Y, X). Bei dieser Eingabeart mussen zudem noch die Gleichungen bezeichnet werden
(siehe Beispiel weiter unten).
Als Beispiel sei folgendes Zweigleichungsmodell betrachtet:
Es besteht auch die Moglichkeit, die endogenen Variablen fur den Beobachtungszeitraum
mit dem Modell zu simulieren. Als Inputdatensatz dient uns also der gleiche Inputdaten-
satz, den wir auch schon zur Schatzung des Modells verwandt haben. In unserem ersten
Beispiel ist das der Datensatz dataset. Die simulierten Ergebnisse fur die beiden endoge-
nen Variablen werden in den Datensatz output 3 geschrieben:
35
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
SOLVE price quantity / DATA=library.dataset
OUT=library.output_3 SIMULATE;
RUN;
9. Prozedur ARIMA
Mit Hilfe der ARIMA Prozedur konnen ARMA Modelle identifiziert, geschatzt und zu Pro-
gnosezwecken genutzt werden. Diese kurze Einfuhrung soll den Leser mit den wichtigsten
Befehlen und Eigenschaften dieser Prozedur bekannt machen.
1. Einfuhrung
PROC ARIMA DATA=library.dataset;
IDENTIFY
VAR = Zeitreihe aus dem Datensatz;
ESTIMATE
P = Ordnung AR-Teil
Q = Ordnung MA-Teil;
OUTEST = library.Datei fur Schatzergebnisse
METHOD = Schatzmethode;
FORECAST
ALPHA = Signifikanzniveau fur Konfidenzintervalle
ID = Variable, die Zeitstempel enthalt;
INTERVAL = Periodizitat der Prognose
LEAD = Anzahl an zu prognostizierenden Perioden
OUT = Datei, in die die Prognoseergebnisse geschrieben werden;
RUN;
QUIT;
36
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Bevor ein ARMA-Modell geschatzt werden kann, muss die Ordnung des Prozesses, d.h.
die maximale Laglange des AR- und MA-Teils, so festgelegt werden, daß er zu der mo-
dellierten Zeitreihe paßt. Die erfolgt in SAS mit Hilfe des Identify-Statements. Ist ein entspre-
chender ARMA-Prozeß festgelegt worden, kann er mit dem Estimate-Statement geschatzt
werden. Das geschatzte Modell kann anschließend mittels des Forecast-Statements zu
Prognosezwecken genutzt werden.
In dieser Reihenfolgen sollen nun die wichtigsten Bestandteile der ARIMA Prozedur vorge-
stellt werden, wobei auch auf den theoretischen Hintergrund eingegangen werden soll.
2. Analyse der Zeitreihe mit Identify
Bei der Identifikation einer Zeitreihe mussen eine Reihe von Schritten durchlaufen werden:
1. White Noise Test der Zeitreihe
2. Vergleich zwischen empirischen und theoretischen Autokorrelationen bzw. partielle
Autokorrelationen
3. Durchfuhren von Schatzungen fur verschiedene p und q
4. Bestimmen von Informationswerten fur die verschiedenen geschatzten Modelle
5. Uberprufen, ob die Parameter signifikant sind
6. White Noise Test der Residuen
Bei den Schritten eins und zwei wird man von SAS durch die Subprozedur Identify un-
terstutzt. Die entsprechende Befehlssequenz lautet dabei:
PROC ARIMA DATA=library.series;
IDENTIFY VAR = variable;
RUN;
Als Ergebnis erhalt man eine Reihe von statistischen Auswertungen fur die Variable va-
riable aus dem Datensatz library.series, die fur die Schritte eins und zwei genutzt werden
konnen.
In dem ersten Schritt, dem White Noise Test, muß uberpruft werden, ob die zu modellieren-
de Zeitreihe autokorreliert ist. Ist sie es nicht, so kann sie auch nicht mit ARIMA-Modellen
modelliert werden. SAS gibt zu diesem Zweck die Ergebnisse der Ljung-Box-Prufgroße her-
aus. Sind diese fur mindestens eine Laglange signifikant von null verschieden, so kann die
37
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Nullhypothese: Die Zeitreihe ist White Noise, abgelehnt und eine Modellierung mit ARMA
Modellen versucht werden.
Die Ljung-Box-Prufgroße ist dabei wie folgt definiert:
Q(K) =T
T + 2
k∑i=1
(T − i)−1r21
mit : T = Anzahl an Beobachtungen
r2i = Quadrierte Autocorrelation i-ter Ordnung
k = Anzahl der berucksichtigten Autocorrelationen
Sie ist asymptotisch χ2-verteilt mit k Freiheitsgraden. Wenn fur mindestens ein k die empi-
rische Prufgroße den kritischen Schwellenwert ubersteigt, wird die Nullhypothese, daß die
Zeitreihe einem White Noise Prozeß folgt, abgelehnt.
In einem zweiten Schritt, der Analyse der Autokorrelationen (ACF) und der partiellen Au-
tokorrelationen (PACF), werden die theoretischen mit den empirischen ACF und PACF ver-
glichen. Die ACF mißt die Korrelation zwischen zwei Zeitpunkten, d.h. sowohl den direkten
Zusammenhang zwischen diesen beiden Zeitpunkten als auch den indirekten. Die PACF
hingegen misst nur die direkte Abhangigkeit der Zeitreihe zu zwei Zeitpunkten.
Zur Identifikation des richtigen Prozesses konnen die folgenden heuristischen Regeln an-
gewandt werden4:
PROC ARIMA DATA=library.series;
IDENTIFY VAR=variable;
ESTIMATE Q=0 P=3 OUTEST=library.out METHOD=ML;
RUN;
QUIT;
Durch den obigen Code wird die zuvor analysierte Variable genutzt, um ein ARMA(3,0)
Modell zu schatzen (q bezeichnet die Lange des MA-, p die des AR-Teils). Die geschatzten
Ergebnisse (vorhergesagten Werte, vorhergesagte Residuen, etc.) werden in die Datei li-
brary.out geschrieben. Als Optimierungsverfahren wird die Maximum Likelihood Methode
verwandt.
Zusatzlich zu den geschatzten Parametern erhalt man sog. Informationswerte, deren Kennt-
nis von Nutzen sein kann zur Identifikation des richtigen Prozesses. Das Ziel besteht darin,
4Vgl. Hansmann, Karl-Werner (1983): Kurzlehrbuch Prognoseverfahren, Wiesbaden, S. 78.
38
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
ein Modell zu wahlen mit einem moglichst geringen Informationswert. SAS gibt zwei Infor-
mationswerte aus. Der Akaike Informationswert ist definiert als: AIC = −2 ln L + q + 2(p)wohingegen der Schwarz-Bayes Informationswert definiert ist als: −2 ln L + (p + q) ln T .
Die geschatzten Paramter sollten alle signifikant sein. Ahnlich wie bei der Probit Prozedur
ist hierbei jedoch eine Besonderheit von SAS zu beachten: SAS kehrt die Vorzeichen der
geschatzen Parameter um! Aus einem Plus wird ein Minus und umgekehrt.
Wahrend die modellierte Zeitreihe kein White Noise Prozeß sein darf, sollen die geschatz-
ten Residuen des ARMA-Modells jedoch, wie von der Theorie gefordert, White Noise sein!
SAS gibt hierzu die Ergebnisse eines White Noise Checks for Residuals aus. Im Gegensatz
zu dem zuvor besprochenen Ljung-Box-Test sollte nun die Nullhypothese: Die Zeitreihe ist
White Noise, beibehalten werden.
3. Schatzung des Modells (Fit)
Hat man ein ARMA Modell identifiziert und geschatzt, kann es genutzt werden, um die
Entwicklung der Zeitreihe mit Hilfe der Subprozedur Forecast zu prognostizieren.
Mit dem der zusatzlichen forecast Zeile in dem obigen Befehl wird eine Prognose fur die
nachsten 24 Monate vorgenommen. Fur die prognostizierte Zeitreihe werden zusatzlich
Konfidenzintervalle auf dem 5% Niveau ausgewiesen. Die Ergebnisse werden dabei in
der Datei library.out p gepeichert.
10. Prozedur AUTOREG
Wann immer davon ausgegangen werden muß, dass die Residuen nicht White Noise sind
und/oder die quadrierten Residuen einer untersuchten Zeitreihe nicht White Noise sind,
muss fur die Residuen und/oder die quadrierten Residuen ein autoregressives Modell un-
terstellt werden. Zu diesem Zweck kann die SAS Prozedur AUTOREG verwandt werden. Die-
se kurze Einfuhrung soll den Leser mit den wichtigsten Befehlen und Eigenschaften dieser
Prozedur bekannt machen.
39
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
1. Einfuhrung
Proc AUTOREG kann genutzt werden, um lineare multiple Regressionsmodelle zu schatzen,
unter zusatzlicher Berucksichtigung von:
• Autoregressiven Prozessen fur die Residuen
• ARCH bzw. GARCH Prozessen fur die Residuen
Die allgemeine Modellspezifikation lautet dabei wie folgt:
yt = x′tβ + vt
vt = εt − ϕ1vt−1 − . . .− ϕmvt−m
εt =√
htet
ht = ω +q∑
i=1
αiε2t−i +
p∑j=1
γjht−j
et ∼ i.i.d. N(0, 1)
Man erkennt, dass bei dieser allgemeinen Modellstruktur sowohl die Autokorreliertheit der
Residuen als auch der quadrierten Residuen berucksichtigt wird.
Die vereinfachte allgemeine Syntax der Prozedur AUTOREG, mit der diese Modellstruktur
implementiert werden kann, sieht wie folgt aus:
PROC AUTOREG DATA=library.dataset; /* Datensatz, auf den zugegriffen werden
soll */
MODEL y = var_1 ... / NLAG=2; /* Regressionsmodell und Anzahl an
berucksichtigten Lags des AR-Prozesses */
GARCH=(Q=q, P=p) MAXIT=100; /* Spezifikation des GARCH Prozesses und
maximale Anzahl an Iterationen */
OUTPUT OUT=library.dataset; /* Outputdatensatz */
RUN;
QUIT;
Die Vorgehensweise bei der Spezifikation dieser Art von Modellen ist ein interaktiver Pro-
zess, der die folgenden Schritte umfassen sollte:
40
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
1. Test, ob autokorrelierte und/oder heteroskedastische Residuen vorliegen
2. Spezifizieren des Modells fur die Residuen
3. Durchfuhren von Schatzungen fur verschiedene p und q
4. Schatzen des Modells
In dieser Reihenfolgen sollen nun die wichtigsten Bestandteile der AUTOREG Prozedur vor-
gestellt werden.
2. Testen auf Autokorrelation mittels Generalized Durbin-Watson Teststatistiken
Der Test auf Autokorrelation der Residuen erfolgt in SAS mittels folgender Befehlssequenz:
PROC AUTOREG DATA=library.dataset;
MODEL y = var_1 ... / DW=4 DWPROB;
RUN;
Mit data = library.dataset wird die zu analysierende Datei spezifiziert. Mit model y = var1 . . .
wird das eigentlich zu schatzende Modell spezifiziert. Mit DW = 4 wird die maximale
Laglange angeben, bis zu der generalized Durbin Watson Prugroßen berechnet werden
sollen. DWPROB weist SAS an, zusatzlich noch Signifikanzniveaus zu den Prufgroßen aus-
zugeben. Mit den generalized DW Prufgroßen kann nicht nur Autokorrelation erster, son-
dern auch hoherer Ordnung modelliert werden. Wenn zumindest eine DW Prufgroße signi-
fikant ungleich null ist, muß die Nullhypothese, dass die Zeitreihe nicht autokorreliert ist,
abgelehnt werden.
3. Testen auf Heteroskedastie mittels Portmanteau Q-Teststatistiken
Der Test auf Heteroskedastie der Residuen erfolgt in SAS mittels folgender Befehlssequenz:
PROC AUTOREG DATA=library.dataset;
MODEL y = var_1 ... / NLAG=2 ARCHTEST
DWPROB;
RUN;
41
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Bis auf die Option nlag = 2, mit der die maximale Laglange angeben wird, bis zu der
Q-Statistiken berechnet werden sollen, stimmen die ubrigen Befehle mit denen uberein,
die wir bereits oben kennengelernt haben. Naturlich konnen diese beiden Schritte auch
in einem Befehl ausgefuhrt werden. SAS gibt dann die Ergebnisse des sog. Portmanteau
Q-Test heraus. Wieder gilt, daß wenn zumindest eine Laglange diese Prufgroße signifikant
von null, verschieden ist, die Nullhypotheses abgelehnt werden muß, daß die Zeitreihe
nicht heteroskedastisch sei.
Wenn festgestellt wurde, dass die Residuen einem autokorrelierten Prozess folgen und zu-
dem noch GARCH Effekte vorhanden sind, kann ein passender Prozess fur die Residuen
entsprechend der bereits in dem vorhergehenden Kapitel besprochenen Kriterien spezifi-
ziert werden.
4. Schatzung des Modells mit autokorrelierten Residuen und GARCH-Effekt
Hat man ein Modell fur die Residuen mit der Hilfe der oben beschriebenen Tests spezifi-
zieren konnen, kann anschließend die Schatzung erfolgen:
PROC AUTOREG DATA=library.dataset;
MODEL y = var_1 ... / NLAG=2 GARCH=(Q=q,P=p) MAXIT = xxx;
OUTPUT OUT= library.out_dataset CEV=n P=m;
RUN;
Neu hinzugekommene Befehle sind dabei: NLAG = 2, mit dem spezifiziert wird, bis zu
welcher Laglange Autokorrelationen der Residuen zugelassen werden, GARCH = (Q =q, P = p), mit dem zusatzlich noch ein bestimmtes GARCH(p,q)-Modell fur die Residuen
modelliert wird, MAXIT = xxx, mit dem die maximale Anzahl an Iterationen festgelegt
werden kann und CEV = n bzw. P = m, womit die geschatzten Residuen bzw. geschatz-
ten Werte in der Outputdatei library.out dataset unter dem Namen n bzw. m gespeichert
werden konnen.
11. Prozedur TSCSREG
Die Prozedur TSCSREG (Time Series Cross Section Regression) dient zur Schatzung von
Panel-Modellen mit SAS. Zu beachten bei der Schatzung mit Panel-Daten ist das Vor-
liegen von unbeobachtbarer zeitlicher und individueller Heterogenitat; Nichtbeachtung
wurde zu verzerrten bzw. inkonsistenten Schatzern fuhren.
42
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Verschiedene Arten von Fehlerstrukturen sind deshalb in der Prozedur enthalten. Neben
Kovarianzmodellen (Fixed Effects-Modelle) konnen auch Fehlerkomponentenmodelle
(Random Effects-Modelle) geschatzt werden. Daruberhinaus konnen mit der Prozedur
auch Modelle mit autoregressiven Fehlerkomponenten geschatzt werden, auf die hier
allerdings nicht eingegangen wird.
Grundsatzlich konnen sowohl one-way als auch two-way error components-Modelle ge-
schatzt werden.
1. Syntax
PROC TSCSREG Optionen;
ID cross_section time_series;
Der Aufruf der Prozedur erfolgt uber den PROC TSCSREG Befehl. Verfugba-
re Optionen sind die Deklaration eines Input-Datensatzes uber DA-
TA=library.datasetname, oder das Erstellen eines Output-Datensatzes, der
neben den Schatzern auch Kovarianzstruktur (COVOUT) sowie Korrelationsmatrix
(CORROUT) und Testergebnisse enthalten kann. Der Output-Datensatz wird uber
den Befehl OUTEST=library.datasetname erzeugt.
Der ID Befehl dient zur Identifikation der Querschnitts- und Langsschnittsvariablen.
Fur die Schatzung ist es dabei wichtig, dass der Datensatz vorher nach diesen
Variablen sortiert wurde.
label:MODEL var1 = var2 var3 ... / Optionen;
Der MODEL Befehl definiert das zu schatzende Modell. In gewohnter Weise kann
das geschatzte Modell mit einem Label versehen werden. var1 ist die abhangige
Variable, var2, var3 ... sind die erklarenden Variablen. Der Unterschied zur klas-
sischen linearen Regression wird durch die Optionen erklart, die nachfolgend im
einzelnen erlautert werden sollen.
FIXONE;
Die FIXONE Option definiert, dass ein Fixed-Effects One-way error components
Modell geschatzt werden soll.
FIXTWO;
Die FIXTWO Option definiert, dass ein Fixed-Effects Two-way error components
Modell geschatzt werden soll.
RANONE;
43
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Die RANONE Option definiert, dass ein Random-Effects One-way error com-
ponents Modell geschatzt werden soll.
RANTWO;
Die RANTWO Option definiert, dass ein Random-Effects Two-way error com-
ponents Modell geschatzt werden soll.
Neben der Deklaration einer einzelnen Fehlerstruktur ist es auch moglich, mehre-
re Arten anzugeben. Die Prozedur schatzt dann sequentiell die einzelnen Modelle.
NOINT;
Die TSCSREG Prozedur schatzt grundsatzlich eine Konstante mit. Der Befehl NOINT
unterdruckt den Einbezug einer Konstanten in das Modell.
RUN;
Der RUN-Befehl startet die Prozedur.
2. Schatzmethode
Die Schatzung erfolgt in Abhangigkeit der unterstellten Fehlerstruktur. Wird ein Fixed Effects-
Ansatz verwendet, schatzt die Prozedur das Modell mit LSDV, d.h. OLS mit Dummy-Variablen
fur die spezifizierten Effekte.
Bei Unterstellung stochastischer Fehler fuhrt die Verwendung von OLS zu ineffizienten Schat-
zern. Das Programm verwendet hier Feasible GLS. Dies ist ein zweistufiges Verfahren, dass
auf der ersten Stufe die Varianz-Komponenten des Modells schatzt. Die geschatzte Varianz-
Kovarianz-Matrix ist dann Grundlage fur die GLS-Schatzung der zweiten Stufe.
3. Output
Das Output-Fenster der Prozedur TSCSREG enthalt standardmaßig folgende Angaben:
• Modellbeschreibung: Fehlerstruktur, Anzahl von Quer- und Langsschnitten
• Anpassungsgute
• (Varianz-Komponenten Schatzer: bei Random Effects-Modellen)
• Testergebnisse: F -Test bei Fixed Effects-Modellen, Hausman m-Test fur Random Effects-
Modelle
• Parameterschatzwerte mit t-Werten und plim
Optional kann daneben die Varianz-Kovarianz-Matrix ausgegeben werden, sofern die
COVB Option gewahlt wurde, sowie die Korrelations-Matrix, wenn die CORRB Option de-
klariert wurde.
44
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
4. Beispiel
Die Schatzung wollen wir am Beispiel5 der Schatzung einer Kostenfunktion verdeutlichen.
Wir verwenden hierzu Daten von Greene (1990)6. Die enthaltenen Variablen sind Produk-
tion von Strom in Millionen Kilowatt-Stunden sowie die daraus entstehenden Kosten (ag-
gregiert aus Arbeits- und Kapitalkosten) fur sechs Firmen zu vier Zeitpunkten.
Folgende Gleichung soll geschatzt werden:
lnCit = α + β lnYit + εit
Der Datensatz mit bereits logarithmierten Werten fur Kosten und Output enthalt die folgen-
den Variablen:
• FIRM (Querschnitts-Identifizierer),
• YEAR (Langsschnitts-Identifizierer),
• OUTPUT (Menge Strom) und
• COST.
5Das Beispiel stammt aus SAS INSTITUTE INC. (1999): SAS/ETS User’s Guide, Version 8, Cary NC., S. 1546 ff.6GREENE, W.H. (1990): Econometric Analysis, New York, MacMillan Publishing Company
45
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
1. Schritt: Einlesen und Sortieren des Datensatzes
DATA greene;
INPUT firm year output cost @@;
CARDS;
1 1955 5.36598 1.14867 1 1960 6.03787 1.45185
1 1965 6.37673 1.52257 1 1970 6.93245 1.76627
2 1955 6.54535 1.35041 2 1960 6.69827 1.71109
2 1965 7.40245 2.09519 2 1970 7.82644 2.39480
3 1955 8.07153 2.94628 3 1960 8.47679 3.25967
3 1965 8.66923 3.47952 3 1970 9.13508 3.71795
4 1955 8.64259 3.56187 4 1960 8.93748 3.93400
4 1965 9.23073 4.11161 4 1970 9.52530 4.35523
5 1955 8.69951 3.50116 5 1960 9.01457 3.68998
5 1965 9.04594 3.76410 5 1970 9.21074 4.05573
6 1955 9.37552 4.29114 6 1960 9.65188 4.59356
6 1965 10.21163 4.93361 6 1970 10.34039 5.25520
;
PROC SORT DATA=greene;
BY firm year;
RUN;
2. Schritt: Sortierung des Datensatzes:
PROC SORT DATA=greene;
BY FIRM YEAR;
RUN;
3. Schritt: Schatzung eines one-way Fixed Effects-Modells und eines one-way Random
Effects-Modells.
PROC TSCSREG DATA=greene;
ID FIRM YEAR;
MODEL cost=output / FIXONE RANONE;
RUN;
46
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Fur die Schatzung des Fixed Effects-Modells erhalt man folgenden Output:
47
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Als Ergebnis der Random Effects-Schatzung erhalten wir:
48
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
12. Prozedur LIFETEST
Die Schatzung von Verweildauern mit Hilfe nichtparametrischer Methoden kann in SAS mit
Hilfe der Prozedur LIFETEST vollzogen werden. Im Gegensatz zu parametrischen Methoden
unterstellen nichtparametrische Schatzer keine funktionale Form fur Hazard-, Dichte- und
Uberlebensfunktion und vermeiden so Verzerrungen in den Schatzern durch eine zu große
Zahl von Restriktionen. Uberdies sind sie zur graphischen Darstellung vorhandener Daten
nutzlich oder fur Voranalysen zur Identifikation einer geeigneten parametrischen Spezifi-
kation.
Die Prozedur LIFETEST berechnet nichtparametrische Schatzer fur die Uberlebensfunktion
mittels Kaplan-Meier-Schatzer (Produkt-Limit-Schatzer) oder Sterbetafel-Methode. Dane-
ben werden Rangstatistiken berechnet, um Zusammenhange zwischen abhangiger Va-
riable und anderen Variablen zu erfassen.
Rechtszensierte Spells sind ein haufiges Problem von Verweildauerdaten. Berucksichtigt
man diese Falle nicht in der Analyse, kommt es zu Dauerverzerrungen, da ublicherweise
langere Episoden eher zensiert sind als kurzere. Eine valide Untersuchung muß also sowohl
nicht-zensierte als auch zensierte Spells umschließen.
1. Syntax
PROC LIFETEST Optionen;
Der Befehl PROC LIFETEST startet die Prozedur. Wichtige Optionen neben der De-
klaration des Input-Datensatzes uber DATA=library.datasetname fur die Analyse
sind folgende:
METHOD=PL; {oder} METHOD=LIFE;
Die Option METHOD legt die Schatzmethode fest. PL Definiert Schatzung mittels
Product-Limit bzw. Kaplan-Meier-Schatzers (alternativ KM). Fur ein Schatzung mit-
tels Sterbetafel-Methode muß LIFE (alternativ ACT (actual), LT) gewahlt werden.
OUTS=library.datasetname;
Der Befehl OUTS deklariert ein Output-Datensatz, der die Schatzer der Uberlebens-
funktion sowie die dazugegehorigen Konfidenzintervalle enthalt.
OUTT=library.datasetname;
Der Befehl OUTT deklariert ein Output-Datensatz, der die Testergebnisse der χ2-
Statistik, der Rangstatistiken sowie deren Varianz-Kovarianz-Matrix enthalt.
49
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
PLOTS=(wert);
Der Befehl PLOTS erstellt Plots der Uberlebensfunktion (S) oder zensierten Beob-
achtungen (C). Daneben konnen auch Plots der negativen logarithmierten Uber-
lebensfunktion (LS) sowie des Logarithmus’ der negativen logarithmierten Uberle-
bensfunktion (LLS) abgebildet werden, um eine unterliegende Exponential- oder
Weibullfunktion zu identifizieren.
Verwendet man die Sterbetafelmethode, konnen außerdem die Hazardrate (h)
sowie die Dichtefunktion (p) geplottet werden.
TIME var1*censor(wert);
Der Befehl TIME ist der wichtigste Befehl der Prozedur LIFETEST. var1 definiert die
Dauervariable, censor ist der Dummy fur zensierte bzw. unzensierte Spells. Zen-
sierte Spells werden durch”wert“ ausgedruckt.
STRATA var2 ...;
Der Befehl STRATA dient zur Einteilung der Daten in unterschiedliche Strata. Dies ist
sinnvoll, wenn man z.B. die Verweildauern von unterschiedlichen Gruppen (bspw.
Teilnehmer und Nichtteilnehmer an einem Experiment) oder unterschieden nach
bestimmten Kovariaten abbilden will. var2 ... sind hierbei Unterscheidungsvaria-
blen.
(Alternativ zum Befehl STRATA kann auch die BY-Option gewahlt werden; hierbei
ist allerdings zu beachten, daß der Datensatz zu erst nach den BY-Variablen ge-
ordnet sein muß. Jedoch werden hier die Plots einzeln zu jeder Auspragung der
BY-Variable erzeugt.)
RUN;
Der RUN-Befehl startet die Prozedur.
2. Output
Der Output der Prozedur LIFETEST enthalt als erstes eine Ubersicht uber die Verweildauern in
jedem Stratum mit Abgangszeitpunkt, Standardfehler und verbleibenden Beobachtungen
im Stratum. Zusatzlich werden weitere Verteilungsmerkmale, wie z.B. Quartile, Mittelwert
und Standardabweichung, ausgegeben.
Der zweite Teil des Outputs ist die Zusammenfassung zensierter und nicht-zensierter Beob-
achtungen, anteilig nach zugeordnetem Stratum und absolut fur die Grundgesamtheit.
Der dritte Teil (nur bei Definition einer Strata-Variable) gibt die Ergebnisse der Test fur Ho-
mogenitat zwischen abhangiger Variable und der (den) Kovariable(n) aus. Hierbei fuhrt
50
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
die Prozedur einen Log-Rank-Test sowie einen Wilcoxon-Rangsummen-Test durch. Neben
der Ausgabe der Rangreihen werden auch die dazugehorigen Kovarianz-Matrizen aus-
gegeben. Als letztes folgt die χ2-Statistik fur die Tests.
Ist die Option PLOTS gewahlt, werden außerdem die gewahlten Plots gegen die Zeit ab-
gebildet.
3. Beispiel
Mit Hilfe eines Kaplan-Meier-Schatzers wollen wir beispielhaft die Dauer einer Remission7
von 21 Leukamie-Patienten nach Behandlung mit einem Medikament (6-mercaptopurine
(6-MP)) sowie von 21 anderen, die mit einem Placebo behandelt wurden, messen. Der
Datensatz stammt von aus Lawless (1982)8 Der Datensatz mp 6 enthalt die Variablen DAYS,
CENSOR und TREATMENT.
• DAYS ist die Dauer der Remission
• CENSOR unterscheidet zensierte (1) und unzensierte (0) Spells
• TREATMENT beschreibt die Behandlung mit dem Medikament (1) oder mit dem Pla-
cebo (0).
1. Schritt: Einlesen des Datensatzes
DATA MP_6;
INPUT days censor treatment @@;
LABEL days="Dauer der Remission";
CARDS;
6 0 1 6 0 1 6 0 1
6 1 1 7 0 1 9 1 1
10 0 1 10 1 1 11 1 1
13 0 1 16 0 1 17 1 1
19 1 1 20 1 1 22 0 1
23 0 1 25 1 1 32 1 1
32 1 1 34 1 1 35 1 1
1 0 0 1 0 0 2 0 0
2 0 0 3 0 0 4 0 0
4 0 0 5 0 0 5 0 0
8 0 0 8 0 0 8 0 0
8 0 0 11 0 0 11 0 0
12 0 0 12 0 0 15 0 0
17 0 0 22 0 0 23 0 0
;
7Remission: Nachlassen von Krankheitserscheinungen, wird besonders bei Krebserkrankungen verwendet.8LAWLESS, J.F.(1982): Statistical Models and Methods for Lifetime Data, Wiley Series in Probability and Ma-
thematical Statistics, New York Chichester Brisbane Toronto Singapore
51
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
2. Schritt: Schatzung der Uberlebensdauer mittels Kaplan-Meier-Schatzmethode
SYMBOL1 C=RED; SYMBOL2 C=BLUE;
PROC LIFETEST DATA=MP_6 PLOTS=(S);
TIME days*censor(1);
STRATA treatment;
RUN;
Die Befehle SYMBOL1 und SYMBOL2 legen die Farben der Survivorfunktionen im Plot fest.
Neben den oben erlauterten Ergebnissen erhalten wir folgenden Plot der Uberlebensfunk-
tion:
Es ist deutlich zu erkennen, daß die Dauer der Remission bei Patienten, die mit dem Me-
dikament behandelt wurden, langer andauert, als bei der Vergleichsgruppe, die mit dem
Placebo behandelt wurden.
52
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
13. Prozedur PHREG
Mit Hilfe der Prozedur PHREG (Proportional Hazards Regression) konnen Proportional Haz-
ards-Modelle geschatzt werden. Dieser semi-parametrische Ansatz wird verwendet, um
den Einfluss erklarender Kovariablen auf die Hazardrate zu untersuchen. Als Vorteil erweist
sich die Annahme, dass die Hazardraten verschiedener Individuen proportional zueinan-
der sind; daher ist eine parametrische Spezifikation der Hazardrate uberflussig.
Die hohere Flexibilitat auf der einen Seite fuhrt jedoch zu einer Beschrankung der An-
wendungsmoglichkeiten auf der anderen Seite. Um die Proportionalitat zu gewahrleisten,
durfen sich bestimmte erklarende Kovariablen in ihrem Verhaltnis uber die Zeit nicht un-
terscheiden. Jedoch kann dieses Problem durch Einfuhrung subpopulationsspezifischer
Basisubergangsraten uberwunden werden.
1. Syntax
PROC PHREG Optionen;
Der Befehl PROC PHREG startet die Prozedur. Wichtige Optionen neben der Dekla-
ration des Input-Datensatzes uber DATA=library.datasetname fur die Analyse sind
folgende:
SIMPLE;
Die Option SIMPLE gibt deskriptive Statistiken zu den erklarenden Variablen aus
(Mittelwert, Standardabweichung, Minimalwert und Maximalwert.
NOPRINT;
Die Option NOPRINT unterdruckt das Output-Fenster und steigert so die Rechen-
geschwindigkeit der Prozedur; sie ist sinnvoll, wenn man die Ergebnisse in ein ge-
sonderters Output-File ubergibt.
NOSUMMARY;
Die Option NOSUMMARY unterdruckt die Ausgabe der Ubersicht uber zensierte
und unzensierte Beobachtungen.
OUTEST=library.datasetname;
Erzeugt einen Output-Datensatz der die Regressionskoeffizienten enthalt. Wird au-
ßerdem die Option COVOUT deklariert, enthalt dieser Datensatz auch die Varianz-
Kovarianz-Matrix der Parameter.
53
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Der Befehl BASELINE OUT=library.datasetname erzeugt einen Output-Datensatz,
der die Schatzer der Uberlebensfunktion fur alle erklarenden Variablen enthalt.
Der OUT-Befehl definiert den neuen Datensatz, der COVARIATES Datensatz (i.d.R.
der Input-Datensatz) muss die erklarenden Variablen enthalten.
MODEL var1*censor(wert)= var2 var3 ... / Optionen;
Der MODEL-Befehl ist das Kernstuck der Prozedur PHREG. Er definiert die abhangi-
ge Variable var1 sowie einen optionalen Zensur-Indikator censor (wert beschreibt
dabei den Index fur zensierte Beobachtungen). Uberdies mussen die erklaren-
den Kovariablen var2 var3 ... nach dem Gleichheitszeichen festgelegt werden.
Folgende Optionen zum MODEL-Befehl stehen zur Verfugung:
TIES=methode;
Die Option TIES=method spezifiziert die Behandlung von Ties (Beobachtungen
gleicher Lange) in der Schatzung. Standardmaßig wird die Likelihoodfunktion
uber den Ansatz von Breslow (1974)9approximiert (BRESLOW). Daruberhinaus ist
es moglich, das PH-Model durch ein diskretes logistisches Model fur diskrete
Zustande zu ersetzen (DISCRETE). Daneben stehen die Approximation von Efron
(1977) (EFRON) sowie ein exakter Ansatz (EXACT) zur Verfugung. Nahere Informa-
tion zu den Schatzern finden sich in Kalbfleisch et al. (1980)10.
SELECTION=method;
Ein wichtiger Anspruch an Verweildauermodelle stellt die Identifikation einflußrei-
cher Kovariablen auf die Hazardrate dar. Zu diesem Zweck kann man mittels der
Prozedur PHREG verschiedene Spezifikationen testen und schatzen. Die Auswahl
der Kovariablen bzw. Sets von Kovariablen kann uber die SELECTION=method Op-
tion erfolgen. Vier verschiedene Vorgehensweisen stehen zur Verfugung. Neben
der standardmaßigen Methode NONE, in der alle spezifizierten Kovariablen in das
Modell mit aufgenommen werden, kann man ausgehend vom Gesamtmodell
einzelne erklarende Variablen schrittweise eliminieren (BACKWARD), das Modell
schrittweise mit den aufgefuhrten Variablen aufbauen (STEPWISE), die Variablen
nacheinander in das Modell aufnehmen (FORWARD) sowie uber die χ2-Statistik
der einzelnen Variablen das beste Set von erklarenden Variablen identifizieren
(SCORE).
SEQUENTIAL;
Die Option SEQUENTIAL fuhrt zu einem aufnehmen der Variable in das Modell nach
der Reihenfolge, in der sie im MODEL-Befehl aufgefuhrt sind.
10BRESLOW, N. (1974):Covariance Analysis of Censored Survival Data, Biometrics, 30, S. 89-9910siehe hierzu KALBFLEISCH, J.D. und R.L. PRENTICE (1980).The Statistical Analysis of Failure Time Data, Wiley
& Sons, New York et al., S. 70 ff.
54
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
SLENTRY=wert;
Die Option SLENTRY=wert definiert das Signifikanzniveau zur Aufnahme einer Va-
riablen in das Modell.
SLSTAY=wert;
Die Option SLSTAY=wert definiert das Signifikanzniveau zur Eliminierung einer Va-
riablen aus dem Modell.
MAXITER=n;
Die Option MAXITER=n definiert die Obergrenze durchzufuhrender Iterationen.
Von vornherein ist dieser Wert auf 25 begrenzt, und kann bei Bedarf beliebig ver-
ringert oder vergroßert werden.
STRATA=variable;
Durch Einbindung von Strata konnen unrealistische Annahmen des PH-Modells
uberwunden werden. So ist es z.B. denkbar, dass sich die Verweildauer in be-
stimmten Intervallen oder fur bestimmte Subpopulationen unterscheidet, was ei-
ne Verletzung der Proportionalitatsannahme zur Folge hat. Mit dem Befehl STRA-
TA=variable konnen verschiedene Strata festgelegt werden, fur die das Verweil-
dauermodell geschatzt wird.
OUTPUT OUT=library.datasetname schatzer=name;
Der Befehl OUPUT OUT=library.datasetname erzeugt einen Output-Datensatz der
die Parameterschatzer (XBETA), Standardfehler der Schatzer (STDXBETA), Schatzer
der Uberlebensfunktion (SURVIVAL) sowie weitere Schatzwerte enthalt.
RUN;
Der RUN-Befehl startet die Prozedur.
2. Output
Folgende Informationen werden im Output-Fenster der Prozedur PHREG ausgegeben:
• Beschreibung des Input-Datensatzes, einschließlich Auffuhrung der abhangigen Va-
riablen, Zensur-Variablen, Methode zur Behandlung von Ties.
• Uberblick uber Anzahl zensierter und unzensierter Beobachtungen (außer bei Dekla-
ration von NOSUMMARY). Einfache Statistiken zu den erklarenden Variablen, sofern
SIMPLE deklariert wurde.
• Statistiken zur Gute des Modells
• Analyse der Maximum-Likelihood Schatzer mit Schatzwerten, Standardfehlern, χ2-
Statistiken sowie Hazardraten.
55
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
3. Beispiel
Die Schatzung mit der Prozedur PHREG wollen wir mit folgendem kleinen Beispiel verdeut-
lichen. Die Daten stammen aus Kalbfleisch et al. (1980)11. Es handelt sich dabei um die
Ergebnisse eines Experiments mit zwei Gruppen von Ratten, die mit dem krebserregenden
Stoff DMBA behandelt wurden sind. Zusatzlich wurden die Ratten radioaktiv bestrahlt. Eine
Gruppe der Ratten wurde in einer keimfreien Umgebung gehalten. Die zugrundeliegende
Fragestellung untersucht, welche Umgebung eine positivere Wirkung auf die Lebensdau-
er hat. Vier Beobachtungen im Datensatz sind rechtszensiert. Dies ist begrundet in einer
anderen Todesursache als dem Krebs.
1. Schritt: Einlesen der Daten. Der Datensatz enthalt die Variablen Dauer (Lebensdauer),
Gruppe (Gruppe 1: keimfreie Umgebung) sowie Zensur, dem Indikator fur zensierter Be-
obachtungen.
DATA RATTEN;
LABEL DAUER = ’Tage von Behandlung bis zum Tod’;
INPUT DAUER GRUPPE ZENSUR @@;
DATALINES;
143 1 0 164 1 0 188 1 0 188 1 0
190 1 0 192 1 0 206 1 0 209 1 0
213 1 0 216 1 0 220 1 0 227 1 0
230 1 0 234 1 0 246 1 0 265 1 0
304 1 0 216 0 0 244 0 0 142 1 1
156 1 1 163 1 1 198 1 1 205 1 1
232 1 1 232 1 1 233 1 1 233 1 1
233 1 1 233 1 1 239 1 1 240 1 1
261 1 1 280 1 1 280 1 1 296 1 1
296 1 1 323 1 1 204 0 1 344 0 1
;
2. Schritt: Schatzung des Modells. Dauer in Abhangigkeit von Gruppe.
PROC PHREG DATA=ratten;
MODEL dauer*zensur(0)=gruppe;
RUN;
Wir erhalten folgende Ergebnisse:
11siehe oben
56
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Folgende Schlußfolgerungen konnen gezogen werden. Aufgrund der drei Testergebnisse
ist anzunehmen, dass sich die Uberlebensfunktionen beider Gruppen unterscheiden. Die
57
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
Hazardrate der Kovariablen Gruppe nimmt den Wert 0.551 an. Da die Variablen die Aus-
pragungen 0 und 1 hat, bedeutet dies, das die Hazardrate der Gruppe 1 niedriger ist als
die der Gruppe 0, d.h. Ratten in der Gruppe 1 (in der keimfreien Umgebung) haben eine
hohere Lebenserwartung als Ratten in der Gruppe 0.
Die Proportionalitats-Annahme ist nur gewahrleistet, wenn die Hazardrate nicht zeitabhan-
gig ist. In einem kurzen Test, wollen wir schauen, ob dies in unserem Beispiel gewahrleistet
ist.
Die Hazardraten in unserem Modell hatte die Form
λ(t) =
h0(t) wenn Gruppe = 0
h0(t)εβ1 wenn Gruppe = 1
Einfache Abweichungen von der Proportionalitatsannahme konnen mit folgender zeitab-
hangigen erklarenden Variablen untersucht werden x = x(t):
x(t) =
0 wenn Gruppe = 0
log(t)− 5.4 wenn Gruppe = 1
Wir verwenden den Logarithmus der Zeit um numerische Instabilitat zu vermeiden. Die
Konstante 5.4 ist der Durschnitt der logarithmierten Dauern. Die Hazardrate der beiden
Gruppen hat nunmehr folgende Form:
εβ1−5.4β2tβ2 ,
mit β2 als Parameter fur die zeitabhangige Variable x. Ist β2 > 0(β2 < 0) bedeutet dies, daß
sich die Hazardrate uber die Zeit erhoht (verringert).
3. Schritt: Ausrechnen der Konstante
DATA ratten;
SET ratten;
log_dauer=log(dauer);
RUN;
PROC MEANS DATA=ratten;
VAR log_dauer;
RUN;
Wir erhalten:
58
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
4. Schritt: Schatzung des Modells unter Einbezug der zeitabhangigen Variablen x:
PROC PHREG DATA=ratten;
MODEL DAUER*ZENSUR(0)=GRUPPE X;
X = GRUPPE * (log_dauer-5.4);
RUN;
Als Ergebnis erhalten wir
Da der Wert der Hazardrate der zeitabhangigen Variable den Wert null annimmt, konnen
wir davon ausgehen, daß in unserem Beispiel keine Anzeichen fur eine zeitabhangige
Hazardrate vorhanden sind.
59
SAS: EINE ERSTE ANWENDUNGSORIENTIERTE EINFUHRUNG FUR OKONOMETRIKER
14. Ubungsaufgaben
Zur Bearbeitung dieser Aufgabe benotigen Sie den ASCII-Datensatz uebung1.asc. Er steht
auf unserer Homepage http://www.wiwi.uni-frankfurt.de/Professoren/hujer/ zum Down-
load bereit.
1. Quantitative Methoden der Volkswirtschaftslehre
AUFGABE 1 (INDIKATOREN UND INDIZES):
a) Berechnen Sie aus den gegebenen Daten fur die Bundesrepublik Deutschland die
Zeitreihen fur folgende Kenngroßen:
- Kapitalintensitat
- Arbeitsproduktivitat
- Kapitalproduktivitat
- unbereinigte Lohnquote
- bereinigte Lohnquote
b) Bilden Sie wegen der besseren Vergleichbarkeit aus den berechneten Großen In-
dizes mit der Basis 1960 gleich 100. Stellen Sie die berechneten Indizes sowie die
Wachstumsraten der Indizes graphisch dar und interpretieren Sie die Verlaufe.
AUFGABE 2 (OLS):
a) Schatzen Sie mit Hilfe der Kleinst-Quadrate-Methode fur die Bundesrepublik Deutsch-
land die Parameter der folgende Cobb-Douglas-Produktionsfunktion:
Yt = C ·Kαt · eλ·t
mit:
Y : Output
K : Kapital
A : Arbeit
t : Zeittrend
C,α, β, λ : zu schatzende Parameter.
b) Interpretieren Sie die geschatzten Parameter und Teststatistiken.
Vorgehensweise:
- Logarithmische Transformation der Produktionsfunktion