Kursens hemsida    schema    aktuellt    kommentarer
Övningar
 

These exercises are from last year. This list will be updated, and possibly translated to English

  1. Simplify the expression [(A'B')-1C]'BA where A and B are non-singu­lar square matrices.
  2. Same for the expression (A'B-1A)-1A'B-1C
  3. Show that the matrix P below is an orthogonal projection matrix, and determine the dimension of the range (image).
           5/6  1/3 -1/6
      P =  1/3  1/3  1/3
          -1/6  1/3  5/6
  4. Determine the vector u such that the expression u'b + u'Au is minimised. Assume that b is a column vector with n rows and A is a symmetric nxn positive definite matrix. Give the answer as a matrix expression.
  5. Same question; What happens if A is not positive definite?
  6. Same question; determine the numerical values of u if
      b' = (1 1 1) and
    
           1  2  1
       A = 2  5  3 
           1  3  4
    Use Excel or some other spreadsheet or suitable computer programme.
  7. Exercise 3 ch. 2.8 in Hansen (mind the typo: y=k should be y=j)
  8. Exercise 4 ch. 2.8 in Hansen (only linear predictor)
  9. Exercise 6 ch. 2.8 in Hansen
  10. Exercise 7 ch. 2.8 in Hansen
  11. Exercise 10 ch. 2.8 in Hansen
  12. Du vill undersöka i vad mån en stats satsning på forskning och utveckling (FoU) påverkar BNP, och vill därför skatta ekvationen

    BNP = β0 + β1 (FoU) + β2N + res

    där BNP och FoU är ges i US$ per år i respektive land och N=in­vånar­antalet.. Du vill skatta denna ekvation med OLS på tvär­snitts­data av länder.

    En kollega säger att du borde använda per-kapita mått i stället, dvs. skatta ekvationen

    BNP/N = α0 + β1 (FoU/N) + res

    a) Varför föreslår hon detta? Finns det anledning att följa hennes råd?

    b) Du skattar ekvationen och får ett värde på β1, och vill tolka den koefficienten som ett mått på hur mycket BNP ökar för en given ökning av FoU. Diskutera denna tolkning.

  13. Du vill se om sjuk­skrivnings­talen skiljer sig mellan regionerna norra, mellersta och södra sverige, och försöker dig på regres­sionen

    S = β0 + β1DN + β2DM + β3DS + res

    där DN, DM och DS är dummy-variabler för norra, mellersta respek­tive södra sverige och S är sjuk­skrivnings­talen (antal sjuk­skrivnings­dagar per år per kapita). Du har data för flera år, men innan du hinner köra regressionen säger en kollega "det där kommer ju inte att fungera".

    a) Vad menar han?

    b) Hur åtgärdar du problemet?

  14. Här är en EXCEL-fil med data på hus­priser (dollar). Vari­ablerna är price (pris), ass_price (taxeringsvärde), bedrooms (antal rum), lot_sz (tomt­storlek i kvadrat­fot) house_sz (yta i kvadrat­fot), colonial ("colonial" stil). Här är samma data i en ASCII-fil (text). Avgör om taxerings­värdet väsentligen bestäms av marknads­värdet, eller om det finns någon (några) egen­skap (egen­skaper) som drar upp (ner) taxerings­värdet i för­hållande till marknads­värdet.
  15. Vi skattar ekvationen

    y = β0 + β1x1 + β2x2 + resid

    med OLS och får (β0, β1, β2) = (1.3, 0.7, -1.4). Vi skattar kovarians­matrisen för dessa skatt­ningar och får

    0.41 -0.16 -0.11
    -0.16 0.41 0.02
    -0.11 0.02 0.38

    Vi kan anta att skatt­ningarna av β-na har en simultan normal­fördelning.

    a) Bestäm 95%-iga konfidens­inter­vall för βi, i=0,1,2.

    b) Bestäm ett 99%-igt konfidens­inter­vall för β1 + β2.

  16. Låt Ω vara en symmetrisk, positivt definit k x k-matris. Låt A och B vara k x m-matriser och antag att

    B'ΩA = A'ΩA.

    Visa att då gäller

    B'ΩB ≥ A'ΩA

    (Olikheten betyder som i Hansen: B'ΩB – A'ΩA är positivt (semi-)definit.)

  17. Du vill veta hur antalet rum i en lägenhet (bostadsrätt) på­verkar dess pris. Du över­väger två regres­sions­modeller:

    pris = β0 + β1(antal rum) + β2(lägenhetsyta) + ... + resid   och

    pris = β0 + β1(antal rum) + ... + resid   (dvs ingen "yta" i ekvationen)

    Diskutera tolkningen av β1 i de två ekva­tionerna.

  18. Du har fått i uppdrag att ta reda på hur bensin­förbruk­ningen för en bil på­verkar dess pris. Eftersom konsu­menterna har en betalnings­vilja för låg bensin­förbruk­ning, bör det höja priset — det bör också medföra en kostnads­ökning pga. mer kompli­cerad teknologi.

    Du skaffar data och kör en regression

    pris = β0 + β1(bensinförbrukning) + resid

    och finner till din förvåning att β1 är positiv! Vad är det som pågår här?

  19. Du vill under­söka hur motion på­verkar väl­befinnandet, speciellt ett mått på "pigghet". "Pigghet" får vara något slags mått på hur pigg och stark och energisk en person känner sig.

    Du försöker hitta alla variabler du kan komma på som förutom motion kan på­verka "piggheten", och kör en regression

    pigghet = β0 + β1(motion) + β2(kost) + β3(rökning) + ... + resid

    Diskutera eventuella problem med tolkningen av denna ekvation.

  20. Du vill under­söka hur längden av en period av arbets­löshet (duration) påverkar personens hazard tillbaks till arbete. "Hazarden" är sannolik­heten att personen under ett dygn får ett arbete. Du försöker finna data som inne­håller upp­gifter på sådant som kan påverka en persons hazard, och kör en variant av regressionen

    hazard = β0 + β1(duraion) + β2(utbildning) + β3(akassa) + β4(invandrare) + β5(kvinna) + ... + resid

    (Jag skriver "variant av denna modell" eftersom funktions­formen inte är den lämpligaste — vi åter­kommer till detta, f.n. bortser vi från det.) Diskutera eventuella problem!

  21. Du vill under­söka om arbets­löshet kan påverka en persons psykiska hälsa, speciellt risken för depression. Du kör därför en regres­sion av typen

    (deprimerad) = β0 + β1(arbetslös) + β2(ekonomi) + β3(gift, sambo) + ... + resid.

    Diskutera eventuella problem med tolk­ningen av denna ekvation.

  22. Är det någon skillnad på hur bra kvinnor och män (s.k. "tjejer" och "killar") lär sig datalogi på KTH:s D-program? Detta vill du under­söka. Du väljer på måfå ut 50 kvinnliga och 50 manliga D-studenter, och kör en regression av typen

    (betyg i datalogi-kurser) = β0 + β1(kvinna) + β2(gymnasiebetyg) + resid.

    En kollega säger att det där blir fel, för du har tagit lika många kvinnliga som manliga studenter, men på D-programmet är bara 15% kvinnor. Du bör ha samma propor­tioner i ditt sample.

    Bör du följa kollegans råd och ändra ditt urval?

  23. I övning 15, bestäm p-värdet för ett Wald-test H0: "β0 = 2.3 och β1 + 2β2 = -1.13".
  24. I uppgift 8, kap. 9.8 föreslår Hansen att man skall skatta en löne-ekvation med vissa instrument­variabler för "education", eftersom denna variabel är endogen. Diskutera lämplig­heten av de före­slagna instrument­variablerna.
  25. Läs uppgift 7, kap 9.9 i Hansen. Visa, mate­matiskt, att Y är en instrument­variabel för P i utbuds-ekva­tionen och W en instrument­variabel för P i efter­fråge-ekva­tionen.
  26. Du vill skatta ekvationen i uppgift 9.8 i Hansen, men vill inklu­dera lön­tagarens ålder också. Du finner i beskriv­ningen av data­setet att "experience" har beräknats genom

    experience = age - education - 6 years

    och genererar därför dataserien

    age = experience + education + 6 years

    och lägger sedan till variabeln "age" till regres­sions­ekvationen.

    a) Vad väntar du dig för resultat av denna skattning?

    b) Du bestämmer dig för att ta med "age" i ekvationen men tar i stället inte med "experience". Jämför tolkningen av koeffi­cienten för "education" i denna ekvation med mot­svarande koeffi­cient i den ur­sprungliga (den i Hansen) ekva­tionen.

  27. Vi betraktar en vanlig regressionsekvation med intercept:

    y = x'β + e

    Antag att vi skattar med instrumentmetoden.

    a) Om vi har lika många instrument som x-variabler, kommer då summan av (de skattade) residualerna att vara = 0?

    b) Samma fråga om vi skattar med 2SLS med fler instrument än x-variabler (svår fråga!)

    c) Samma fråga som i b) men vi skattar med (effektiv) GMM (också svår fråga!)

  28. Uppgift 5.8 i Hansen.
  29. I övning 15 har vi fått följande x-värden: x1 = 6, x2 = 1. Bestäm ett 95%-igt prediktions­intervall för mostvarande y. Vi har skattat residu­alens varians till 0.35, och vi antar att den är normalfördelad.
  30. Uppgift 5.5 i Hansen. Använd samma teknik som den jag använde i beviset för sats 2 den 9/2 (se Aktuellt).

Exempeltenta

Jag har blivit ombedd att göra en "exempel­tenta". Jag har ännu inte tänkt så mycket på tentan, men nå't i den här stilen blir det nog. Nu blev det inga numeriska ut­räkningar i den här exempel­tentan, men det kan det bli på den riktiga. Ni skall alltså ha med er mini­räknare då — någon­ting i stil med övning 12 eller 21 kan jag tänka mig att ge.

  1. Du vill göra en studie av hur stor studie­skuld en person har som just av­slutat sina studier och står i begrepp att söka arbete. Du har ett data­set på personer som just av­slutat studierna med upp­gifter på studie­skuld, studie­tid (antal år efter gym­nasiet), ålder, föräldink (föräldrarnas samman­lagda års­inkomst). Du är speciellt intres­serad av inflytandet av föräld­rarnas inkomst på studie­skulden, och kör en regres­sion:

    (studieskuld) = β0 + β1(studietid) + β2(ålder) + β3(föräldink) + resid.

    Du får väldigt stora standard­avvikelser i din skattning

    a) Vad misstänker du är orsaken till det dåliga resultatet?

    b) Vad föreslår du för åtgärd för att få bättre skattning av β3?

  2. Du vill undesöka i vilken mån arbets­lösa som deltar i "åtgärder" (arbets­marknads­åtgärder, t.ex. någon ut­bildning) fortare får ett arbete än de som inte deltar i något sådant program. Det är fri­villigt att del­taga, och du vill an­vända en (för­hopp­nings­vis) posi­tivt på­visad effekt som ett argu­ment för att del­taga.

    Du har ett data­set med upp­gifter på per­soner som för två år sedan var arbets­lösa. Alla har nu fått arbete, och du har upp­gifter på: 1) Duration (arbets­löshets­tidens längd) 2) del­tagit (i åtgärd, dummy), 3) ut­bildning (år), 4) er­faren­het (arbets­livs­erfarenhet, år), 5) ålder (år) 6) in­komst (kr/år, dvs. a-kassa plus ev. annan inkomst.)

    a) Föreslå en lämplig modell att skatta.

    b) OLS är en olämplig skattningsmetod. Förklara varför!

    c) Vad behöver du göra för att få en riktig skattning?

  3. Du vill skatta en regres­sions­ekvation

    y = β0 + β1x1 + β2x2 + resid.

    Du vill egent­ligen testa hypo­tesen att β1 + β2 = 1, mer precist: du vill ha ett konfidens­intervall för β1 + β2.

    Du har ett enkelt dator­program för att göra regres­sioner, men tyvärr rappor­terar det inte hela kovarians­matrisen för para­meter­skatt­ningarna, utan bara standard­av­vikelserna för de enskilda koeffici­enterna (β-na).

    Ange en regres­sions­ekvation där du direkt kan avläsa punkt­skat­tningen för β1 + β2 och standard­av­vikelsen för denna skatt­ning.

  4. Betrakta en regressionsekvation

    y = β0 + β1x1 + β2x2 + resid.

    Visa att mätfel i t.ex. x1 skapar problem med "endo­genintet"

  5. Du vill skatta sanno­lik­heten för "default" (sanno­lik­heten att en lån­tagare går i kon­kurs och inte kan betala till­baks sitt lån). Här gäller det att göra en predik­tion av denna sanno­likhet, baserad på upp­gifter om 1) lån (lånets storlek i kr), inkomst (lån­tagarens års­inkomst), 3) an­märkning (regist­rerade betal­nings­an­märiningar, antal).

    Du har ett dataset med många lån med uppgifter om 1)–3) samt om default (dummy).

    a) Föreslå en predik­tions­modell att skatta.

    b) Ange en lämplig skatt­nings­metod.

  6. Betrakta regressions­ekvationen

    y = β0 + β1x1 + β2x2 + β3x3 + resid.

    Du skattar den med OLS och får skatt­ningen (b0, b1, b2, b3) för para­metrarna (β0, β1, β2, β3). Antag att stick­provs-korrela­tionen mellan x1 och x3 samt mellan x2 och x3 är noll.

    a) Bevisa att en OLS på ekva­tionen

    y = β0 + β1x1 + β2x2 + resid.

    ger samma värden på β1 och β2.

    b) Blir det också samma standard­av­vikelser för dessa para­metrar? Motivera!


  1. Hansen uppgift 7.1.
  2. Hansen uppgift 7.5
  3. Hansen uppgift 9.3
  4. Hansen uppgift 9.6
  5. Betrakta regres­sions­modellen

    yi = xi'β + ei

    Antag att vi vill göra en predik­tion av y för ett "out of sample" x-värde x0. Visa att vi kan göra detta på följande sätt:

    Lägg till en obser­vation, nummer 0, med y0=0 och x-värdena x0 och dess­utom en extra dummy­variabel D0 i ekva­tionen

    yi = xi'β + αD0 + ei

    där D0 = -1 för observa­tion 0 och 0 för alla övriga observa­tioner. Då kommer koeffici­enten α att vara den optimala prediktorn (med OLS) för y betingat x=x0, och den skattade standard­av­vikelsen för α blir följ­aktligen en skatt­ning av standard­av­vikelsen för denna prediktor.

  6. Du har en ekvation du vill skatta

    y = x'β + e

    men har anledning att tro att med den tolkning du vill ge ekva­tionen är x1 positivt korre­lerad med e. Om du nu skattar ekva­tionen med OLS, hur på­verkas då koeffici­enten β1? Dvs. kommer den skattade para­metern att bli för stor eller för liten? Motivera!


 

Valid HTML 4.01! valid css