Aktuell information för kursen
SF1910 Tillämpad statistik, 7.5hp, för CSAMH, period 2, ht 2018.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Tentan 17 apr 2019 med lösningar är utlagd.
Tentan 8 jan 2019 med lösningar är nu utlagd.
Räknestugor
Räknestugor är nu inbokade Må 26 nov kl 13-15 sal U41
To 6 dec kl 10-12 sal L52
On 12 dec kl 10-12 salU41
To 13 dec kl 13-15 sal V22
Kontrollskrivning
Kontrollskrivningen finns nu på länkarna
Kontrollskrivning
Kontrollskrivningen Onsdagen 21/11 omfattar kap2-5.
Formel och Tabellsamling
På tentan kommer inte längre egen medhavd Formelsamling
och tabellsamling
i matematisk statistik längre att tillåtas som hjälpmedel. I stället
delas Formelsamling
och tabellsamling
i matematisk statistik ut vid själva tentamenstillfället och lämnas
sedan in igen av tentanden tillsammans med tentan.
Instruktion om hur man anmäler sig till lab2
Gå in på personer.Välj en grupp 1-80. Gå in i kalender. Klicka på
"Hitta möte". Välj kurs. Klicka på "Lämna in".Välj tid. Klicka på
"Reservera".
Laboration 2
De som önskar redovisa Laboration 2 måste boka en redovisningstid
senast måndag 10/12 kl 23.59. Boka laborationstid genom att först
anmäla er till en av de 80 grupper för SF1910 Datorlaboration som
finns under fliken Personer på Canvassidan. Boka sedan in er grupp
på ett av redovisningspassen i kalendern för SF1910.
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och öppna
Matlab samt ta fram era redovisningsuppgifter. Skriv även upp
vilken dator ni sitter vid på whiteboarden i datorsalen, så att
labbassistenten lätt hittar er när redovisningstiden börjar.
Ni behöver också ha med er en utskrift av labspecifikationen som
ni har skrivit era personnummer på förstasidan på. Denna utskrift
undertecknar labassistenten efter att han eller hon har godkänt
labben och utskriften fungerar sedan som ert kvitto på resultatet.
Projektarbetet
Observera eftermiddagen fredag 23 nov. Det är då projekten
introduceras och startas upp.
Observera att projektarbetet är obligatoriskt och ger 1.5 hp.
Om ni har frågor eller funderingar angående projektarbetet så kan ni
höra av till Han-Suck Song med e-mail: han-suck.song@abe.kth.se så
ser han till att frågan hamnar rätt.
Kontrollskrivning
Anmälningstiden till kontrollskrivningen 21/11 är?/?-?/?.
Tentamen
Anmälningstiden till tentan 8/1 är ?/?-?/?.
Datorlaborationer
De som ej har konto med MATLAB kan
skaffa det genom att ladda ner det från KTH:s hemsida.
Notera att datorlaborationerna inte är obligatoriska men att
Laboration 2 kan ge 4 bonuspoäng till del II på tentamen 8/1-2018
samt till första omtentan.
Gamla tentor
På gamla tentor fick man använda formelsamlingen BETA. Det får man
ej längre.
Föreläsningsinformation
Mån 10 dec Gjorde först övningsuppgift 13.21a för att visa hur
man tar fram styrkan hos ett test när man har använt sig av
konfidensintervallmetoden. Utifrån detta visades även hur man tar
fram styrkefunktionen. Fortsatte med att berätta när CHI-2-test
används och tog som inledande exempel på detta uppgift 5 på tentan
som gavs 8 juni 2018. Gick sedan grundligt igenom exempel 13.18 i
läroboken som exempel på test av given fördelning där man dels måste
skatta minst en parameter ur data (i detta fall μ) för att skatta p1,p2,..
pr, dels slå ihop grupper för att villkoret npi≥5
skall gälla för alla i.Berättade sedan om när homogenitetstest
används och tog som exempel på detta uppgift 5 på tentan som gavs 17
augusti 2015. Berättade efter detta att man vid oberoendetest kan
använda sig av identiskt samma numerik som man gör vid
homogenitetstest. Visade uppgift 5 på tentan 2017-01-09 som exempel
på detta.
Tor 6 dec Började med att använda mig av exempel 13.8 för att
göra hypotesprövning i fallet ensidigt test, dels med
kofidensintervallmetoden dels med testvariabelmetoden. Även här
gjordes detta med olika värden på risknivån α och m.h.a. detta
visades också här i vilket intervall p-värdet måste ligga. Fortsatte
därefter med exempel 13.4 i läroboken, där man tar fram styrkan hos
testet i exempel 13.1 för alternativet p=0.9, och tog även fram
styrkefunktionen h(p) i detta fall. Misslyckades på slutet med att
göra övningsuppgift 13.21a för att visa hur man tar fram styrkan hos
ett test när man har använt sig av konfidensintervallmetoden och
utifrån detta även visa hur man tar fram styrkefunktionen. Detta
kommer att visas på nästa föreläsning som också är den sista. Resten
av denna sista föreläsning kommer helt att ägnas åt §14.3 i F.S och
handla om olika fall av CHI2-test.
Tis 4 dec Började med att härleda konfidensintervallet för
standardavvikelsen och för variansen utgående från att summan av
kvadrerade N(0,1)-variabler tillhör CHI2-fördelningen. Visade sedan
hur man utgående från §12.4 i F.S. tar fram konfidensintervallet för
standardavvikelsen och för variansen. Inledde sedan kapitel 13 med
att skriva upp en lista på viktiga definitioner och begrepp som
används inom hypotesprövning såsom nollhypotes,mothypotes, risknivå,
p-värde, och styrka. Gick därefter igenom exempel 13.1 i läroboken
som exempel på ett fall där man inte använder konfidensintervall för
att testa sin nollhypotes. Införde i samband med detta begreppen
testvariabel och kritiskt område. Som exempel på hypotesprövning
m.h.a. konfidensintervall-metoden använde jag mig därefter av
exempel 13.8 i läroboken som jag även använde mig av för att
exemplifiera hypotesprövning m.h.a.testvariabelmetoden.Hann dock
bara fallet tvåsidigt test.
Fre 30 nov Repeterade först begreppen konfidensintervall och
konfidensgrad. Repeterade även hur konfidensitervallet för
väntevärdet ser ut när man har observationer från en
Normalfördelning både i fallet med känd standardavvikelse och när
standardavvikelsen är okänd. Därefter visades konfidensintervallet
för skillnaden mellan väntevärdena hos två Normalfördelade stickprov
där standardavvikelserna är kända. Sedan visades hur man bildar ett
konfidensintervall med approximativ konfidensgrad för skillnaden
mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och olika. Därefter visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
lika och hur man m.h.a. §11.2 viktar ihop de två
stickprovsvarianserna för att få en skattning s av
standardavvikelsen. Efter detta visades det viktiga fallet när man
har parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa skillnader. Kom
sedan in på de fall där man använder §12.3 i F.S. för att ta fram
konfidensintervall med approximativ konfidensgrad . Visade att om
stickproven är så stora så att C.G.S. kan användas, så kan man bilda
konfidensintervall med approximativ konfidensgrad för väntevärden
och skillnader mellan väntevärden även om observationerna inte
kommer från en Normalfördelning. Fortsatte med att visa ytterligare
exempel på konfidensintervall med approximativ konfidensgrad: för p
när X tillhör Bin(n,p), för py- px när Y tillhör Bin(ny,py) och X
tillhör Bin(nx,px) samt för my i Poisson-fördelningen och visade att
det i alla dessa fall förutsätter att Normalapproximation är möjlig
enligt villkoren i §5.
Tor 29 nov Började med att repetera begreppen TÄTA,TÄTA*
,TÄTA*obs.Definierade efter detta begreppet konsistens. Tog sedan
exempel 11.19 i läroboken som exempel på hur
Minsta-kvadrat-skattning går till när två saker ska
skattas.Definierade därefter begreppen konfidensintervall och
konfidensgrad i allmänna fallet och visade även hur ensidiga
konfidensintervall ser ut. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd.Visade också hur man
får samma konfidensintervall m.h.a.§12.1. Visade utgående från detta
hur man generellt bildar ensidigt nedåt begränsade och ensidigt
uppåt begränsade konfidensintervall. Visade sedan utgående från det
första konfidensintervallet hur det tvåsidiga konfidensintervallet
för väntevärdet ser ut när mätdata kommer från en Normalfördelning
där standardavvikelsen är okänd.Visade också hur man får samma
konfidensintervall m.h.a.§12.2.
Tis 27 nov Började kap 11 med att redogöra för skillnaden
mellan det riktiga värdet TÄTA,stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning hur man
brukar skatta väntevärdet my och standardavvikelsen sigma vid okänd
fördelning. Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa. Tog sedan som
ytterligare exempel på skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen.Definerade sedan begreppet medelfel och tog
ett par exempel på detta. Presenterade därefter
Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken som
exempel på denna. Fortsatte med att gå igenom
Minsta-Kvadrat-metoden. Avslutade att som exempel visa hur man kan
göra MK-skattningen av arean hos en kvadrat.
Ons 21 nov Började med kap 10 och definierade medelvärde,
stickprovsvarians, populationsvarians, variationskoefficient,
median, kovarians och korrelationskoefficient. Gick sedan igenom
begreppen grupperade data,absolut och relativ frekvens,
klassindelade data,histogram och boxplott.Avslutade kapitel 10 med
att visa hur man tar fram kvartiler och percentiler.Fortsatte sedan
med att skriva upp en lista på viktiga definitioner och begrepp som
används inom hypotesprövning såsom nollhypotes,mothypotes, risknivå,
och p-värde.Gick sedan igenom linjär regression. Visade sedan hur
man i multipel regression m.h.a. nollhypotesen H0 :?i
=0 kan avgöra om man ska kasta respektive oberoende variabel xi
eller ej. Avslutade med övningsuppgift 14.7 som exempel på detta.
Mån 19 nov Skrev först upp täthetsfunktionen och
fördelningsfunktionen för normalfördelningen. Skrev efter det upp
täthetsfunktionen och fördelningsfunktionen för standardiserade
normalfördelningen N(0,1). Skrev sedan upp att om X är N(E[X],D[X])
så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och
hur man använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för
k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och
visade sedan på väggen även sannolikheterna för att ett utfall
hamnar minst två respektive tre standardavvikelser ifrån
väntevärdet. Avslutade med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2
används och pekade på tabell 2 för att visa vad k ungefär blir när
sannolikheterna är 0.99 och 0.999. Räknade sedan exempel 6.2a,b som
exempel på att varje linjärkombination av oberoende N-fördelade
slumpvariabler är normalfördelad.Fortsatte med att gå igenom den
viktiga Centrala Gränsvärdessatsen (CGS), som säger att summan av n
oberoende likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort, och att detta även medför att
medelvärdet är approximativt normalfördelat. Avslutade kapitel 6 med
att göra Exempel 6.6 som exempel på Centrala Gränsvärdessatsen.
Avslutade med att sammanfatta kap 7 genom att gå igenom §6 i
Formelsamlingen.
Tor 15 nov Började med att repetera definitionerna för
väntevärde, varians och standardavvikelse i det diskreta och det
kontinuerliga fallet. Definierade även variationskoefficienten.
Repeterade därefter följande viktiga räkneregler för väntevärden och
varianser: E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X
och Y är oberoende V(X+Y)=V(X)+V(Y). Definierade sedan begreppet
kovarians och visade att V(X)=C(X,X). Definerade sedan begreppet
korrelationskoefficient och berättade om dess egenskaper. Visade att
om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y) vilket
i sin tur leder till att C(X,Y)=0, d.v.s. att X och Y är
okorrelerade. Visade sedan att omvändningen inte behöver vara sann
genom att göra exempel 5.13 i läroboken. Definierade E[g(X,Y)]. Som
övning på att räkna ut en kovarians gjorde jag sedan övningsuppgift
5.18. Gick sedan igenom räkneregler för kovarianser och skrev upp
att C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
m.h.a. att V(X)=C(X,X) leder till den viktiga regeln att
V(X+Y)=V(X)+V(Y)+2C(X,Y) och att V(X+Y)=V(X)+V(Y) om X och Y är
oberoende.
Ons 14 nov Avslutade kapitel 4 med ex 4.9 som exempel på
summa av två ober stok.var. Visade att summan av ober
Poisonfördelade stok.var. är Poissonfördelad. Började med kapitel 5
och startade med att berätta att väntevärdet är vad man får i
genomsnitt om man gör oändligt många försök. T.ex. blir ju det
genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan exempel
5.1 i boken. Skrev sedan upp definitionen för E(X) resp. E(g(X)) i
det diskreta fallet och det kontinuerliga fallet. Tog sedan och
räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter variansen
för X och standardavvikelsen D(X). Sedan använde jag mig även här av
ex 5.1 i boken för att räkna ut variansen m.h.a. definitionen.
Härledde sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och
räknade ut samma varians m.h.a. denna formel. Gick avslutningsvis
igenom följande viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c, V(aX+b)=V(aX)=a²V(X), samt om
X och Y är oberoende: V(X+Y)=V(X)+V(Y).Avslutade med att ta fram
väntevärde och standardavvikelse för medelväret av n st ober
stokastiska variabler.
Ons 7 nov Tog först exempel 3.14 i läroboken som exempel på
en blandad fördelning av en diskret och en kontinuerlig stokastisk
variabel,där den kontinuerliga stokastiska variabeln tillhör den
likformiga fördelningen. Fortsatte sedan med att gå igenom
funktioner av stokastiska variabler. Tog som exempel i det diskreta
fallet exempel 3.16 i Blom och som kontinuerliga exempel gjorde jag
exempel 3.20 och exempel 3.19 i Blom. Fortsatte med att gå igenom
flerdimensionella diskreta och kontinuerliga stokastiska variabler.
Gick igenom begreppen simultan sannolikhetsfunktion repektive
simultan täthetsfunktion och hur man ur dessa får fram den
marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade till sist hur man räknar ut sannolikheter i det
två-dimensionella diskreta och kontinuerliga fallet. Avslutade med
att visa hur man tar fram Fördelningsfunktionen för max(X,Y) och
min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y.
Tis 6 nov Började med att gå igenom Binomialfördelningen och
Poissonfördelngen och att summan av två oberoende Poissonfördelade
stokastiska variabler är Poissonfördelad. Fortsatte sedan med
kontinuerliga stokastiska variabler. Definierade täthetsfunktionen
och gick igenom hur man ur den får fram Fördelningsfunktionen och
vice versa. Gick därefter igenom exponentialfördelningen.Fortsatte
med att visa att tiden mellan två händelser är exponentialfördelad
om antalet händelser är Poissonfördelat. Visade även att
exponentialfördelningen saknar minne.Gick sedan igenom den
likformiga fördelningen och tog som exempel på denna exempel 3.9 i
läroboken.Berättade att eftersom hela kapitel 6 ägnas åt
Normalfördelningen gås den igenom då.
Fre 2 nov Började med att repetera Betingningsformeln,
Lagen om total sannolikhet, och Bayes sats.Gick därefter igenom ex
2.20 som en intressant tillämpning av Bayes sats. Visade sedan
definitionen för oberoende utgående från betingningsformeln.
Avslutade kapitel 2 med exempel 2.23 som exempel på
oberoende.Inledde kapitel 3 med att gå igenom begreppet stokastisk
variabel och definera sannolikhetsfunktionen. Tog som exempel på
denna ex 3.1 i läroboken och ritade även upp stolpdiagrammet.
Definierade sedan Fördelningsfunktionen och berättade om dess
egenskaper. Tog som exempel på denna ex 3.1 i läroboken och ritade
även upp den. Gick sedan igenom ett antal viktiga diskreta
fördelningar. Började med tvåpunktsfördelningen och då speciellt
Bernoullifördelningen. Fortsatte med den likformiga fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom den hypergeometriska
fördelningen. Binomialfördelningen och Poissonfördelningen hanns ej
med och gås igenom nästa föreläsning.
Ons 31 okt Började med fallet dragning med återläggning
med hänsyn till ordning. Fortsatte med fallet dragning utan
återläggning med hänsyn till ordning. Gick sedan igenom fallet
dragning utan återläggning utan hänsyn till ordning. Gick därefter
igenom sannolikheten att vid n dragningar utan återläggning utan
hänsyn till ordning dra k vita kulor från v vita och s svarta kulor.
Utvidgade sedan detta till sannolikheten att dra v vita och; s
svarta och g gula o.s.v när man har r färger. Började sedan med
betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna. Visade
även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som exempel
på denna.
Tis 30 okt Presenterade först kursens hemsida som hittas på
http://www.math.kth.se/matstat/gru och visade olika länkar och dess
innehåll. Fortsatte sedan med ge exempel på olika användningsområden
som ämnet matematisk statistik har och denna kurs ger en
introduktion till. Började sedan med att gå igenom
utfall,utfallsrum,händelser.Förklarade därefter skillnaden mellan
diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b
som exempel på diskreta utfallsrum. Gick sedan igenom snitt, union,
komplement och visade hur man med hjälp av Venndiagram räknar ut
sannolikheter. Definierade i samband med detta disjunkthet.Skrev upp
Kolmogorovs axiomsystem.Resten av tiden presenterades inledningen av
kombinatoriken. Hann med multiplikationsprincipen och den klassiska
sannolikhetsdefinitionen.
|