Kursens hemsida schema aktuellt kommentarer | |
Övningar |
These exercises are from last year. This list will be updated, and possibly translated to English
5/6 1/3 -1/6 P = 1/3 1/3 1/3 -1/6 1/3 5/6
b' = (1 1 1) and 1 2 1 A = 2 5 3 1 3 4
BNP = β0 + β1 (FoU) + β2N + res
där BNP och FoU är ges i US$ per år i respektive land och N=invånarantalet.. Du vill skatta denna ekvation med OLS på tvärsnittsdata av länder.
En kollega säger att du borde använda
per-kapita mått i stället, dvs. skatta ekvationen
BNP/N = α0 + β1 (FoU/N) + res
a) Varför föreslår hon detta? Finns det anledning att följa hennes råd?
b) Du skattar ekvationen och får ett värde på β1, och vill tolka den koefficienten som ett mått på hur mycket BNP ökar för en given ökning av FoU. Diskutera denna tolkning.
S = β0 + β1DN + β2DM + β3DS + res
där DN, DM och DS är dummy-variabler för norra, mellersta respektive södra sverige och S är sjukskrivningstalen (antal sjukskrivningsdagar per år per kapita). Du har data för flera år, men innan du hinner köra regressionen säger en kollega "det där kommer ju inte att fungera".
a) Vad menar han?
b) Hur åtgärdar du problemet?
y = β0 + β1x1 + β2x2 + resid
med OLS och får (β0, β1, β2) = (1.3, 0.7, -1.4). Vi skattar kovariansmatrisen för dessa skattningar och får
0.41 | -0.16 | -0.11 |
-0.16 | 0.41 | 0.02 |
-0.11 | 0.02 | 0.38 |
Vi kan anta att skattningarna av β-na har en simultan normalfördelning.
a) Bestäm 95%-iga konfidensintervall för βi, i=0,1,2.
b) Bestäm ett 99%-igt konfidensintervall för β1 + β2.
B'ΩA = A'ΩA.
Visa att då gäller
B'ΩB ≥ A'ΩA
(Olikheten betyder som i Hansen: B'ΩB – A'ΩA är positivt (semi-)definit.)
pris = β0 + β1(antal rum) + β2(lägenhetsyta) + ... + resid och
pris = β0 + β1(antal rum) + ... + resid (dvs ingen "yta" i ekvationen)
Diskutera tolkningen av β1 i de två ekvationerna.
Du skaffar data och kör en regression
pris = β0 + β1(bensinförbrukning) + resid
och finner till din förvåning att β1 är positiv! Vad är det som pågår här?
Du försöker hitta alla variabler du kan komma på som förutom motion kan påverka "piggheten", och kör en regression
pigghet = β0 + β1(motion) + β2(kost) + β3(rökning) + ... + resid
Diskutera eventuella problem med tolkningen av denna ekvation.
hazard = β0 + β1(duraion) + β2(utbildning) + β3(akassa) + β4(invandrare) + β5(kvinna) + ... + resid
(Jag skriver "variant av denna modell" eftersom funktionsformen inte är den lämpligaste — vi återkommer till detta, f.n. bortser vi från det.) Diskutera eventuella problem!
(deprimerad) = β0 + β1(arbetslös) + β2(ekonomi) + β3(gift, sambo) + ... + resid.
Diskutera eventuella problem med tolkningen av denna ekvation.
(betyg i datalogi-kurser) = β0 + β1(kvinna) + β2(gymnasiebetyg) + resid.
En kollega säger att det där blir fel, för du har tagit lika många kvinnliga som manliga studenter, men på D-programmet är bara 15% kvinnor. Du bör ha samma proportioner i ditt sample.
Bör du följa kollegans råd och ändra ditt urval?
experience = age - education - 6 years
och genererar därför dataserien
age = experience + education + 6 years
och lägger sedan till variabeln "age" till regressionsekvationen.
a) Vad väntar du dig för resultat av denna skattning?
b) Du bestämmer dig för att ta med "age" i ekvationen men tar i stället inte med "experience". Jämför tolkningen av koefficienten för "education" i denna ekvation med motsvarande koefficient i den ursprungliga (den i Hansen) ekvationen.
y = x'β + e
Antag att vi skattar med instrumentmetoden.
a) Om vi har lika många instrument som x-variabler, kommer då summan av (de skattade) residualerna att vara = 0?
b) Samma fråga om vi skattar med 2SLS med fler instrument än x-variabler (svår fråga!)
c) Samma fråga som i b) men vi skattar med (effektiv) GMM (också svår fråga!)
Exempeltenta
Jag har blivit ombedd att göra en "exempeltenta". Jag har ännu inte tänkt så mycket på tentan, men nå't i den här stilen blir det nog. Nu blev det inga numeriska uträkningar i den här exempeltentan, men det kan det bli på den riktiga. Ni skall alltså ha med er miniräknare då — någonting i stil med övning 12 eller 21 kan jag tänka mig att ge.
(studieskuld) = β0 + β1(studietid) + β2(ålder) + β3(föräldink) + resid.
Du får väldigt stora standardavvikelser i din skattning
a) Vad misstänker du är orsaken till det dåliga resultatet?
b) Vad föreslår du för åtgärd för att få bättre skattning av β3?
Du har ett dataset med uppgifter på personer som för två år sedan var arbetslösa. Alla har nu fått arbete, och du har uppgifter på: 1) Duration (arbetslöshetstidens längd) 2) deltagit (i åtgärd, dummy), 3) utbildning (år), 4) erfarenhet (arbetslivserfarenhet, år), 5) ålder (år) 6) inkomst (kr/år, dvs. a-kassa plus ev. annan inkomst.)
a) Föreslå en lämplig modell att skatta.
b) OLS är en olämplig skattningsmetod. Förklara varför!
c) Vad behöver du göra för att få en riktig skattning?
y = β0 + β1x1 + β2x2 + resid.
Du vill egentligen testa hypotesen att β1 + β2 = 1, mer precist: du vill ha ett konfidensintervall för β1 + β2.
Du har ett enkelt datorprogram för att göra regressioner, men tyvärr rapporterar det inte hela kovariansmatrisen för parameterskattningarna, utan bara standardavvikelserna för de enskilda koefficienterna (β-na).
Ange en regressionsekvation där du direkt kan avläsa punktskattningen för β1 + β2 och standardavvikelsen för denna skattning.
y = β0 + β1x1 + β2x2 + resid.
Visa att mätfel i t.ex. x1 skapar problem med "endogenintet"
Du har ett dataset med många lån med uppgifter om 1)–3) samt om default (dummy).
a) Föreslå en prediktionsmodell att skatta.
b) Ange en lämplig skattningsmetod.
y = β0 + β1x1 + β2x2 + β3x3 + resid.
Du skattar den med OLS och får skattningen (b0, b1, b2, b3) för parametrarna (β0, β1, β2, β3). Antag att stickprovs-korrelationen mellan x1 och x3 samt mellan x2 och x3 är noll.
a) Bevisa att en OLS på ekvationen
y = β0 + β1x1 + β2x2 + resid.
ger samma värden på β1 och β2.
b) Blir det också samma standardavvikelser för dessa parametrar? Motivera!
yi = xi'β + ei
Antag att vi vill göra en prediktion av y för ett "out of sample" x-värde x0. Visa att vi kan göra detta på följande sätt:
Lägg till en observation, nummer 0, med y0=0 och x-värdena x0 och dessutom en extra dummyvariabel D0 i ekvationen
yi = xi'β + αD0 + ei
där D0 = -1 för observation 0 och 0 för alla övriga observationer. Då kommer koefficienten α att vara den optimala prediktorn (med OLS) för y betingat x=x0, och den skattade standardavvikelsen för α blir följaktligen en skattning av standardavvikelsen för denna prediktor.
y = x'β + e
men har anledning att tro att med den tolkning du vill ge ekvationen är x1 positivt korrelerad med e. Om du nu skattar ekvationen med OLS, hur påverkas då koefficienten β1? Dvs. kommer den skattade parametern att bli för stor eller för liten? Motivera!