4


Aktuell information för kursen SF1910/SF1925 Tillämpad statistik, 7.5hp, för CSAMH,CLGYM period 2, ht 2019.
Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.



Scanningsapparaten tillfälligt sönder

Scanningsapparaten är tillfälligt sönder. Detta är orsaken till att ni inte kunnat se KS-resultaten än.


Instruktion om hur man anmäler sig till lab2

Gå in på personer. Välj en grupp 1-96. Gå in i kalender. Klicka på "Hitta möte". Välj kurs. Klicka på "Lämna in".Välj tid. Klicka på "Reservera".

Laboration 2


De som önskar redovisa Laboration 2 måste boka en redovisningstid senast tisdag 10/12 kl 23.59. Boka laborationstid genom att först anmäla er till en av de 96 grupper för SF1910/SF1925 Datorlaboration som finns under fliken Personer på Canvassidan. Boka sedan in er grupp på ett av redovisningspassen i kalendern för SF1910/SF1925.

Se till att komma till labsalen minst tio minuter före redovisningstiden så att ni hinner logga in på datorn och öppna Matlab samt ta fram era redovisningsuppgifter.

Ha med er en utskrift av labspecifikationen som ni har skrivit era personnummer på förstasidan på. Denna utskrift undertecknar labassistenten efter att han eller hon har godkänt labben och utskriften fungerar sedan som ert kvitto på resultatet.


Kontrollskrivning

Nu ligger kontrollskrivningen med lösningsförslag ute under båda länkarna Gamla tentor och KS.


Tider och salar för Räknestugorna

To 28 nov kl 8-10,  sal E52  
To 5 dec kl 13-15,  sal Q31 
On 11 dec kl 10-12,  sal W37

Sal W37 ligger på Teknikringen 78 på våningsplan 3 och har rumsnummer 341.


Kontrollskrivning

Kontrollskrivningen Onsdagen 20/11 omfattar kap2-5.

Formel och Tabellsamling

På tentan kommer inte längre egen medhavd  Formelsamling och tabellsamling i matematisk statistik längre att tillåtas som hjälpmedel. I stället delas  Formelsamling och tabellsamling i matematisk statistik ut vid själva tentamenstillfället och lämnas sedan in igen av tentanden tillsammans med tentan.

BETA ej längre tillåtet hjälpmedel på tentan

På gamla tentor stod  att BETA är tillåtet hjälpmedel på tentan.  Observera att BETA ej längre är tillåtet hjälpmedel på tentan.




Mån 9 dec  Började med att berätta när CHI-2-test används och tog som inledande exempel på detta uppgift 5 på tentan 8 juni 2018. Första timmen ägnades sedan helt åt att grundligt gå igenom exempel 13.18 i läroboken som exempel på test av given fördelning där man dels måste skatta minst en parameter ur data (i detta fall μ) för att skatta p1,p2,.. pr, dels slå ihop grupper för att villkoret npi≥5 skall gälla för alla i. Berättade sedan om när homogenitetstest används och tog som exempel på detta en forskningsrapport där man ville undersöka huruvida det var någon skillnad mellan 36 timmar gamla pojkar och flickor vad gällde vad de föredrog att titta på. Berättade efter detta att man vid oberoendetest kan använda sig av identiskt samma numerik som man gör vid homogenitetstest. Visade uppgift 5 på tentan 2017-01-09 som exempel på detta.

Ons 4 dec
  Inledde med att som repitition skriva upp samma lista som föregående föreläsning på viktiga definitioner och begrepp som används inom hypotesprövning, såsom nollhypotes,mothypotes, risknivå, p-värde, och styrka.Fortsatte sedan sedan med exempel 13.8  och gjorde nu hypotesprövning i fallet ensidigt test, dels med kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika värden på risknivån ? och m.h.a. detta visades också i vilket intervall p-värdet måste ligga. Gjorde sedan övningsuppgift 13.21a för att visa hur man tar fram styrkan hos ett test när man har använt sig av konfidensintervallmetoden. Utifrån detta visades även hur man tar fram styrkefunktionen - i detta fall h(?) där ? =?x-?y. Gick sedan igenom linjär regression och visade att parametrarna ? och ? skattas med Minsta-kvadrat-metoden. Fortsatte med att visa hur man i multipel regression m.h.a. nollhypotesen H0 :?i =0 kan avgöra om man ska kasta respektive oberoende variabel xi eller ej. Gjorde övningsuppgift 14.7a som exempel på detta. Avslutade med att skissa några exempel där man med hjälp av residualanalys kan avgöra huruvida det är troligt att y beror linjärt av x.


Tis 3 dec  Inledde med att skriva upp en lista på viktiga definitioner och begrepp som används inom hypotesprövning, såsom nollhypotes,mothypotes, risknivå, p-värde, och styrka.Gick därefter igenom exempel 13.1 i läroboken som exempel på ett fall där man inte använder konfidensintervall för att testa sin nollhypotes.Fortsatte därefter med exempel 13.4 i läroboken, där man tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9, och tog även fram styrkefunktionen h(p) i detta fall.Började sedan med exempel 13.8 och gjorde hypotesprövning i fallet tvåsidigt test, dels med konfidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika värden på risknivån ? och m.h.a. detta visades också i vilket intervall p-värdet måste ligga. Hann sedan göra hypotesprövning i fallet ensidigt test med konfidensintervallmetoden innan det var dags att sluta.


Fre 29 nov Började med att repetera konfidensintervallet för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är okända och lika och hur man m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få en skattning s av standardavvikelsen. Efter detta visades det viktiga fallet när man har parvisa observationer-"stickprov i par"- och att konfidensintervallet för väntevärdet av de parvisa skillnaderna då tas fram som om man har ett stickprov av parvisa skillnader. Som exempel på "Skillnad mellan stickprov" visades tentatal 2019-06-05:15 och som exempel på "Stickprov i par" visades tentatal 2019-08-12:15. Gick sedan igenom konfidensintervall med approximativ konfidensgrad där §12.3 används. Visade att om stickproven är så stora så att C.G.S. kan användas, så kan man bilda konfidensintervall med approximativ konfidensgrad för väntevärden och skillnader mellan väntevärden även om observationerna inte kommer från en Normalfördelning. Avslutade kapitel 12 med att visa konfidensintervall med approximativ konfidensgrad för p när X tillhör Bin(n,p), för py- px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px) samt för my i Poisson-fördelningen och att det i alla dessa fall förutsätter att Normalapproximation är möjlig enligt villkoren i §5 respektive §6. Tog därefter fram konfidensintervallet för standardavvikelsen utgående från §12.4 i Formelsamlingen. Visade utgående från detta konfidensintervall hur konfidensintervallet för variansen ser ut. Visade också utgående från det tvåsidiga konfidensintervallet för standardavvikelsen hur man tar fram det ensidiga.

Ons 27 nov Började med att gå igenom Minsta kvadrat-metoden genom att skriva upp den formel för Q som ska minimeras som står i §9.2 . Tog sedan ett eget exempel där man vill skatta ytan av en kvadrat genom att mäta upp sidans längd och diagonalens längd. Tog sedan exempel 11.19 i läroboken som exempel på hur Minsta-kvadrat-skattning går till när två saker ska skattas.Definierade därefter begreppen konfidensintervall och konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga konfidensintervallet för väntevärdet när mätdata kommer från en Normalfördelning där standardavvikelsen är känd.Visade också hur man får samma konfidensintervall m.h.a.§12.1. Visade utgående från detta exempel hur man generellt bildar ensidigt nedåt begränsade och ensidigt uppåt begränsade konfidensintervall. Visade sedan m.h.a. §12.2 hur det tvåsidiga konfidensintervallet för väntevärdet ser ut när mätdata kommer från en Normalfördelning där standardavvikelsen är okänd.Därefter visades m.h.a §12.1 och §11.3 konfidensintervallet för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är kända. Därefter visades m.h.a.§12.2 konfidensintervallet för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är okända och lika och hur man m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få en skattning s av standardavvikelsen.Sedan visades hur man m.h.a.§12.3 bildar ett konfidensintervall med approximativ konfidensgrad för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är okända och olika.


Mån 25 nov
Började kap 11 med att redogöra för skillnaden mellan det riktiga värdet TÄTA,stickprovsvariabeln TÄTA* och punktskattningen TÄTA*obs. Tog som exempel på skattning hur man brukar skatta väntevärdet my och standardavvikelsen sigma vid okänd fördelning. Definerade därefter begreppen väntevärdesriktighet och effektivitet och tog ett par enkla exempel på dessa. Tog sedan som ytterligare exempel på skattningar hur man skattar p i Binomialfördelningen,Hypergeometriska fördelningen och ffg-fördelningen,my i Poissonfördelningen, lambda i exponentialfördelningen.Definerade sedan begreppet medelfel och tog som exempel på detta skattningarna av andel i Binomialfördelningen och ? i Poissonfördelningen. Definierade begreppet konsistens. Presenterade därefter Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken som exempel på denna.


Mån 18 nov
Började med kap 10 och definierade medelvärde, stickprovsvarians, populationsvarians, variationskoefficient, median, kovarians och korrelationskoefficient.Gjorde övningsuppgifterna 10.2b 0ch 10.7 som exempel på hur man tar fram medelvärde, stickprovsstandardavvikelse och korrelationskoefficient utgående från givna data. Gick sedan igenom begreppen grupperade data,absolut och relativ frekvens, klassindelade data,histogram och boxplott.Avslutade kapitel 10 med att visa hur man tar fram kvartiler och percentiler.Fortsatte sedan med att skriva upp en lista på viktiga definitioner och begrepp som används inom hypotesprövning såsom nollhypotes,mothypotes, risknivå, och p-värde.Gick sedan igenom linjär regression. Visade sedan hur man i multipel regression m.h.a. nollhypotesen H0 : beta i =0 kan avgöra om man ska kasta respektive oberoende variabel xi eller ej. Avslutade med övningsuppgift 14.7 som exempel på detta.


Tor 14 nov Började med att göra exempel 6.2a,b som exempel på att varje linjärkombination av oberoende N-fördelade slumpvariabler är normalfördelad.Fortsatte med att gå igenom den viktiga Centrala Gränsvärdessatsen (CGS), som säger att summan av n oberoende likafördelade stokastiska variabler är approximativt normalfördelad om n är stort, och att detta även medför att medelvärdet är approximativt normalfördelat. Presenterade sedan den viktiga Centrala Gränsvärdessatsen (CGS), som säger att summan av n oberoende likafördelade stokastiska variabler är approximativt normalfördelad om n är stort, och att detta även medför att medelvärdet är approximativt normalfördelat. Avslutade kapitel 6 med att göra Exempel 6.6 som exempel på Centrala Gränsvärdessatsen. Definierade sedan Hypergeometriska fördelningen och skrev upp dess sannolikhetsfunktion. Definierade sedan Binomialfördelningen och skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N<0.1. Visade sedan utgående från Bernoullifördelningen att villkoret np(1-p)>10 för Normalapproximation egentligen är ett C.G.S.-villkor. Fortsatte med att gå igenom halvkorrektion. Definierade efter detta Poissonfördelningen. Avslutade kap 7 med att berätta att sannolikhetsdefinitionen för Binomialfördelningen övergår i sannolikhetsfunktionen för Poissonfördelningen om p är litet, vilket motiverar att om p<0.1 så gäller att Bin(n,p)~Po(np).

Ons 13 nov
  Definierade E[g(X,Y)]. Som övning på att räkna ut en kovarians slutförde jag sedan övningsuppgift 5.18a och b. Gick sedan igenom räkneregler för kovarianser och skrev upp att C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a. m.h.a. att V(X)=C(X,X) leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Började efter det med kap 6 Normalfördelningen. Skrev först upp täthetsfunktionen och fördelningsfunktionen för normalfördelningen. Skrev efter det upp täthetsfunktionen och fördelningsfunktionen för standardiserade normalfördelningen N(0,1). Skrev sedan upp att om X är N(E[X],D[X]) så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man använder Tabell 1 och Tabell 2 i formelsamlingen och vad alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och visade sedan på väggen även sannolikheterna för att ett utfall hamnar minst två respektive tre standardavvikelser ifrån väntevärdet. Avslutade med att ta fram k när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2 används och pekade på tabell 2 för att visa vad k ungefär blir när sannolikheterna är 0.99 och 0.999.

Mån 11 nov Började med kapitel 5 och startade med att berätta att väntevärdet är vad man får i genomsnitt om man gör oändligt många försök. T.ex. blir ju det genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp. E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog sedan och räknade ut E(X²) i Ex. 5.1 i boken.Definierade även medianen för X. Definierade därefter variansen för X och standardavvikelsen D(X). Definierade även Variationskoefficienten. Sedan använde jag mig även här av ex 5.1 i boken för att räkna ut variansen m.h.a. definitionen. Härledde sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade ut samma varians m.h.a. denna formel. Gick avslutningsvis igenom följande viktiga räkneregler för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c, V(aX+b)=V(aX)=a²V(X), samt om X och Y är oberoende: V(X+Y)=V(X)+V(Y).Tog därefter fram väntevärde och standardavvikelse för medelväret av n st ober stokastiska variabler. Avslutade första timmen med att skriva upp Stora talens lag.
Definierade sedan begreppet kovarians och visade att V(X)=C(X,X). Definerade sedan begreppet korrelationskoefficient och berättade om dess egenskaper. Visade att om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0, d.v.s. att X och Y är okorrelerade. Visade sedan att omvändningen inte behöver vara sann genom att göra exempel 5.13 i läroboken. Som övning på att räkna ut en kovarians gjorde jag till sist övningsuppgift 5.18a.

Tors 7 nov Började med att gå igenom funktioner av stokastiska variabler. Tog som exempel i det diskreta fallet exempel 3.16 i Blom och som kontinuerliga exempel gjorde jag exempel 3.20 och exempel 3.19 i Blom. Fortsatte med att gå igenom flerdimensionella diskreta och kontinuerliga stokastiska variabler. Gick igenom begreppen simultan sannolikhetsfunktion repektive simultan täthetsfunktion och hur man ur dessa får fram den marginella sannolikhetsfunktionen respektive den marginella täthetsfunktionen och hur man vid oberoende även kan gå åt andra hållet. Visade sedan hur man räknar ut sannolikheter i det två-dimensionella diskreta och kontinuerliga fallet.Fortsatte med att visa hur man tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y.
Gjorde ex 4.9 som exempel på summa av två diskreta ober stok.var. Visade i och med detta den viktiga satsen att summan av ober Poissonfördelade stok.var. är Poissonfördelad. Avslutade med övningsuppgift 4.23 för att visa hur man löser problem av typ summa av två ober stok.var. i kontinuerliga fallet.


Tis 5 nov Började med att gå igenom Binomialfördelningen och Poissonfördelngen och att summan av två oberoende Poissonfördelade stokastiska variabler är Poissonfördelad. Tog exempel 7.7 som exempel på detta. Fortsatte sedan med kontinuerliga stokastiska variabler. Definierade täthetsfunktionen och gick igenom hur man ur den får fram Fördelningsfunktionen och vice versa. Gick därefter igenom exponentialfördelningen.Fortsatte med att visa att tiden mellan två händelser är exponentialfördelad om antalet händelser är Poissonfördelat. Visade även att exponentialfördelningen saknar minne.Gick sedan igenom den likformiga fördelningen och tog som exempel på denna exempel 3.9 i läroboken.Berättade att eftersom hela kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Avslutade med att som exempel på blandad(diskret och kontinuerlig) fördelning gå igenom exempel 3.14


Ons 30 okt  Inledningsvis visade jag Bayes sats m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna. Visade sedan definitionen för oberoende utgående från betingningsformeln. Avslutade kapitel 2 med exempel 2.23 som exempel på oberoende.Inledde kapitel 3 med att gå igenom begreppet stokastisk variabel och definera sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp stolpdiagrammet. Definierade sedan Fördelningsfunktionen och berättade om dess egenskaper. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick sedan igenom ett antal viktiga diskreta fördelningar. Började med tvåpunktsfördelningen och då speciellt Bernoullifördelningen. Fortsatte med den likformiga fördelningen och för-första-gången-fördelningen och den snarlika geometriska fördelningen. Avslutade med att gå igenom den  hypergeometriska fördelningen. Binomialfördelningen och Poissonfördelningen hanns ej med och gås igenom på nästa föreläsning.


Tis 29 okt Började med fallet dragning med återläggning med hänsyn till ordning. Fortsatte med fallet dragning utan återläggning med hänsyn till ordning. Gick sedan igenom fallet dragning utan återläggning utan hänsyn till ordning. Gick därefter igenom sannolikheten att vid n dragningar utan återläggning utan hänsyn till ordning dra k vita kulor från v vita och s svarta kulor. Utvidgade sedan detta till sannolikheten att dra v vita och; s svarta och g gula o.s.v när man har r färger. Började sedan med betingad sannolikhet. Illustrerade betingningsformeln m.h.a. exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.


Mån 28 okt Presenterade först kursens hemsida som hittas på http://www.math.kth.se/matstat/gru (och på canvas) och visade olika länkar och dess innehåll. Fortsatte sedan med ge exempel på olika användningsområden som ämnet matematisk statistik har och denna kurs ger en introduktion till. Började sedan med att gå igenom utfall,utfallsrum,händelser.Förklarade därefter skillnaden mellan diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b som exempel på diskreta utfallsrum. Gick sedan igenom snitt, union, komplement och visade hur man med hjälp av Venndiagram räknar ut sannolikheter. Definierade i samband med detta disjunkthet. På slutet av föreläsningen presenterades inledningen av kombinatoriken. Hann med den klassiska sannolikhetsdefinitionen och multiplikationsprincipen.







 















 


[Kursförteckning]     [Avdelningen Matematisk statistik]
Sidansvarig: Björn-Olof Skytt
Uppdaterad: 2019-10-21