Aktuell information för kursen
SF1910 Tillämpad statistik, 7.5hp, för CSAMH, period 2, ht 2017.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Tentan 5 april ligger nu på länkarna
Gamla
tentor och KS i SF1910 och Gamla
tentor och KS i SF1901
Formel och Tabellsamling
På tentan kommer inte längre egen medhavd Formelsamling
och tabellsamling
i matematisk statistik längre att tillåtas som hjälpmedel. I stället
delas Formelsamling
och tabellsamling
i matematisk statistik ut vid själva tentamenstillfället och lämnas
sedan in igen av tentanden tillsammans med tentan.
Extra föreläsning Måndag 18 dec 14-16 i F2
Laboration 3
Se till att komma till labbsalen minst tio minuter före redovisningstiden så att ni hinner logga in
på datorn och öppna Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av labbspecifikationen som ni har skrivit era personnummer
på förstasidan på. Denna utskrift undertecknar labbassistenten efter att hen har godkänt labben och
utskriften fungerar sedan som ert kvitto på resultatet.
Kontrollskrivningarna är nu rättade och inlämnade till scanning.
Övningsgrupp 4
Den ordinarie övningsassistenten Per Jörgen Säve Söderbergh är
fr.o.m. nu tillbaka från höstlovet.
Projektarbetet
Observera att det är obligatorisk närvaro på lektionen på
förmiddagen fredag 24 nov. Det är då projekten introduceras och
startas upp.
Information om projektarbete
Observera att projektarbetet är obligatoriskt.
Om ni har frågor eller funderingar angående projektarbetet så kan ni
höra av till Han-Suck Song med e-mail: han-suck.song@abe.kth.se så
ser han till att frågan hamnar rätt.
Kontrollskrivning
Anmälningstiden till kontrollskrivningen 22/11 är 25/10-8/11.
Tentamen
Anmälningstiden till tentan 8/1 är 20/11-18/12.
Datorlaborationer
De som ej har konto med MATLAB kan
skaffa det genom att ladda ner det från KTH:s hemsida.
Notera att datorlaborationerna inte är obligatoriska men att
Laboration 3 kan ge 3 bonuspoäng till tentamen 8/1-2018 (endast till
denna tentamen).
Den förberedande Laboration
1 ges främst till för de som inte kan Matlab eller vill
friska upp sina kunskaper. Denna laboration går av stapeln onsdag
8/11 10:15-12:00.
Laboration 2 löses på egen hand, men gås igenom i detalj på
föreläsningen fredag 1 december 10:15-12:00.
Laboration 3 redovisas fredag 15/12 13:00-15:00. Godkännande
av laborationen sker under laborationstillfället, vilket innebär
att de två timmarna endast används för redovisning. Alltså måste
både skriftliga individuella förberedelseuppgifter samt
laborationsuppgifter vara förberedda innan laborationstillfället.
Användbara och nödvändiga m-filer och datafiler till
datorlaborationerna finns här.
Föreläsningsinformation
On 13 dec Föreläsningen var en katastrof
eftersom jag var sjuk i magen och var tvungen att springa på
toaletten hela tiden.Det jag hann med var att gå igenom CHI-2-test
ordentligt.Jag berättade när CHI-2-test
används och tog som ett inledande exempel på detta exempel 13.17 i
läroboken. Fortsatte sedan med 13.18 i läroboken som exempel på
test av given fördelning där man dels måste skatta parametrar ur
data för att skatta p1,p2...pr,
dels slå ihop grupper för att villkoret npi≥5 skall
gälla för alla i. Däremot hann jag varken gå igenom Homogenitetstest
eller Oberoendetest, vilket är viktiga moment i kursen. Därför kommer
det att hållas en extra föreläsning måndag 18 december kl 14-16 i F2
där det som inte hanns med i dag kommer att gås igenom då. Den tid
som då blir över kommer att ägnas åt repetition.
Må 11 dec
Gick först igenom exempel 13.1 i läroboken som exempel på ett
fall där man inte använder konfidensintervall för att testa sin
nollhypotes. Införde i samband med detta bgreppen signifikant*,
signifikant**, och signifikant***, samt begreppen testvariabel och
kritiskt område. Fortsatte med exempel 13.4 i läroboken där man
tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9,
och tog även fram styrkefunktionen h(p) i detta fall. Presenterade sedan Maximum-likelihood-metoden och räknade
exempel 11.10 i läroboken som exempel på denna. Fortsatte med att gå
igenom Minsta-kvadrat-metoden. Som exempel visades hur man kunde
göra MK-skattningen av arean hos en kvadrat där 3 mätdata var
sidans längd, och 1 mätdata var diagonalens längd Tog sedan linjär regression som exempel på hur
Minsta-kvadrat-skattning går till när två saker ska skattas - i detta fall α och β.
On 6 dec Höll en demonstrationsföreläsning
som i detalj gick igenom lab 2 och
som även finns
här .I samband med denna visades också hur man
generar slumptal för kontinuerliga
fördelningar utgående från U(0,1)-fördelningen. Tog
som exempel i det kontuerliga fallet hur man tar fram
slumptal för exponentialfördelningen genom att
invertera fördelningsfunktionen.
Må 4 dec Började med att skissa några exempel
där man med hjälp av residualanalys kan avgöra huruvida det är troligt
att y beror linjärt av x eller ej. Började sedan med hypotesprövning och
inledde denna med att repetera definitionerna
av nollhypotes,mothypotes,risknivån alfa,p-värdet och styrkan hos ett test.
Med exempel 13.8 gjordes sedan hypotesprövning i fallet tvåsidigt test,
dels med kofidensintervallmetoden dels med testvariabelmetoden.
Detta gjordes med olika värden på risknivån α och m.h.a. detta visades
också i vilket intervall p-värdet måste ligga.
Gjorde sedan hypotesprövning i fallet ensidigt test,dels med
kofidensintervallmetoden dels med testvariabelmetoden.
Även här gjordes detta med olika värden på risknivån α och m.h.a. detta
visades också här i vilket intervall p-värdet måste ligga.
Gjorde sedan en utvidgad variant av exempel 13.5 för att visa hur man tar fram
styrkan hos ett test när man har använt sig av konfidensintervallmetoden.
Utifrån detta visades även hur man tar fram styrkefunktionen h(θ), som i detta fall är h(μ).
Fre 1 dec Började med att visa
konfidensintervallet för det viktiga fallet när
standardavvikelserna är okända men antas vara lika och hur man
m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få
en skattning s av standardavvikelsen. Efter detta visades det
viktiga fallet när man har parvisa observationer-"stickprov i
par"- och att konfidensintervallet för väntevärdet av de parvisa
skillnaderna då tas fram som om man hade ett stickprov av parvisa
skillnader. Gick sedan igenom Chi2-fördelningen och visade hur man
tar fram konfidensintervall för standardavvikelsen m.h.a. §12.4
och visade att man genom att kvadrera gränserna får ett
konfidensintervall för variansen. Inledde sedan kap 13 som handlar
om hypotesprövning. Berättade om och skrev upp definitioner
av nollhypotes,mothypotes,risknivån alfa,p-värdet och styrkan hos
ett test.Gick sedan igenom linjär regression och vad
beteckningarna i formelsamlingens §13 betyder. Gick sedan på OH
igenom exempel 14.7 i läroboken som exempel på hur man med hjälp
av multipel regression går tillväga för att avgöra vilka storheter
xi man ska förkasta eller inte förkasta när man har
antagit att y beror av xi:na.
Tor 30 nov Började med att repetera
begreppet konfidensintervall och konfidensintervallet som
härleddes på förra föreläsningen. Visade hur man tar fram detta
konf-int m.h.a. §12.1. Visade sedan hur man bildar ett
approximativt konf-int för väntevärdet m.h.a. §12.3 och
Centrala Gränsvärdessatsen om observationerna inte kommer från
Normalfördelningen, men är tillräckligt många. Visade därefter hur
man m.h.a. §12.3 tar fram konf-int för μ i
Poissonfördelningen, p i Binomialfördelningen, samt konf-int för
py-px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px), och att
det i alla dessa fall förutsätter att N-approx är möjlig
enligt respektive villkor i §6. Utgående från konfidensintervallet
med känd standardavvikelse som kan tas fram m.h.a. §12.1 visades
sedan m.h.a §12.2 hur motsvarande konfidensintervall ser ut
då standardavvikelsen är okänd. Berättade i samband med detta kort
om frihetsgrader, t-fördelningen och tabell 3. Därefter visades
först konfidensintervallet för skillnaden mellan väntevärdena från
två stickprov när standardavvikelserna är kända mh.a.§12.1. Sedan
visades det approximativa konfidensintervallet för skillnaden
mellan väntevärdena från två stickprov när standardavvikelserna är
okända och olika m.h.a. §12.3. Slutligen visades m.h.a. §12.2
konfidensintervallet för skillnaden mellan väntevärdena från två
stickprov när standardavvikelserna är okända men antas vara lika,
och hur man m.h.a. §11.2 viktar ihop de två stickprovsvarianserna
för att få en skattning s av standardavvikelsen.
Tis 28 nov Började kap 11 med att redogöra för
skillnaden mellan det riktiga värdet TÄTA, stickprovsvariabeln
TÄTA* och punktskattningenTÄTA*obs. Tog som exempel på skattning
hur man brukar skatta väntevärdet my och standardavvikelsen sigma
vid okänd fördelning. Tog sedan som ytterligare exempel på
skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i Normalfördelningen.
Definierade efter detta begreppet medelfel och tog fram medelfelet
för skattningen av väntevärdet my allmänt , och medelfelet för
skattningen av parametern my i Poissonfördelningen. Definerade
därefter begreppen väntevärdesriktighet och effektivitet och tog
ett par enkla exempel på dessa. Definierade även begreppet
konsistens.Inledde sedan kapitel 12 med att definiera begreppen
konfidensintervall och konfidensgrad i allmänna fallet och visade
även hur ensidiga konfidensintervall ser ut. Härledde därefter det
tvåsidiga konfidensintervallet för väntevärdet när mätdata kommer
från en Normalfördelning där standardavvikelsen är känd. Visade
till sist utgående från detta hur de ensidiga konfidensintervallen
ser ut.
Tor 23 nov Började kapitel 7 med att definiera
hypergeometriska fördelningen och skrev upp dess
sannolikhetsfunktion. Definierade sedan Binomialfördelningen och
skrev upp dess sannolikhetsfunktion. Talade efter detta om att
Hyp(N,n,p)~Bin(n,p) om n/N ≤1/10. Genom att visa att när X∈
Bin(n,p), så kan även X skrivas som en summa av n stycken
Bernouilly-fördelade stok.var, motiverades att
Binomialfördelningen går att approximera till Normalfördelningen
när np(1-p)≥10. Gick därefter igenom halvkorrektion. Skrev sedan
upp satsen att summan av två oberoende Poissonfördelningar är
Poisson-fördelad. Använde sedan denna sats när jag genom att dela
upp ett intervall i n st delintervall motiverade att
Poisson-fördelningen kan approximeras till Normalfördelningen om
μ≥15.Avslutade kapitel 7 med att tala om-utan att visa
det-att Binomialfördelningen kan approximeras till
Poissonfördelningen om p≤0.1.Fortsatte med kap 10 och definierade
medelvärde, stickprovsvarians, variationskoefficient, median,
kovarians och korrelationskoefficient. Gick sedan igenom begreppen
grupperade data, absolut och relativ frekvens, klassindelade data,
histogram och boxplott. Avslutade kapitel 10 med att visa hur man
tar fram kvartiler och percentiler.
Mån 20 nov Började med kapitel 6 om
Normalfördelning. Skrev upp och ritade upp Normalfördelningens
täthetsfunktion och Fördelningsfunktion.Skrev upp och ritade upp
Standardnormalfördelningens täthetsfunktion och
Fördelningsfunktion.Visade hur man kan transformera varje
Normalfördelning N(E[X],D[X]) till standardnormalfördelningen
N(0,1). Berättade sedan om när och hur man använder tab 1 och tab
2 i formelsamlingen och vad alfa-kvantilen är. Räknade sedan
exempel 6.2a som exempel på hur tabell 1 används. Som exempel på
att varje linjärkombination av oberoende Normalfördelade stok.var.
är Normalfördelad räknades sedan exempel 6.2b. Tog sedan fram
P(E[X]-2D[X]<X<E[X]-2D[X]) när X är Normalfördelad, och
skrev sedan upp sannolikheterna för att ett utfall hamnar högst en
respektive tre standardavvikelser från väntevärdet. Som exempel på
hur man använder tab 2 tog jag fram k när
P(E[X]-2D[X]<X<E[X]-2D[X])=0.95 respektive 0.99. Gick
därefter igenom den viktiga Centrala Gränsvärdessatsen (C.G.S.),
som säger att summan av n oberoende likafördelade stokastiska
variabler är approximativt normalfördelad om n är stort. Detta
medför även att medelvärdet är approximativt normalfördelat.
Avslutade kapitel 6 med att göra Exempel 6.6 som exempel på
Centrala Gränsvärdessatsen.
Tor 16 nov Började med att repetera
definitionerna för väntevärde och varians i det diskreta och
kontinuerliga fallet i en dimension. Repeterade därefter även
definitionerna på kovarians och korrelationskoefficient.
Definierade sedan E[g(X,Y)] i det diskreta och det kontinuerliga
fallet.Som övning på att räkna ut en kovarians gjorde jag sedan
övningsuppgift 5.18. Gick sedan igenom räkneregler för kovarianser
och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende.
Skrev sedan upp följande viktiga räknelagar för
väntevärden och varianser.
- E[aX + bY +c] = aE[X] + bE[Y]+c
- V(aX + b) = V(aX) = a2V(X)
- V(X + Y) = V(X) + V(Y) + 2C(X,Y)
samt om X och Y är oberoende
- E[XY] = E[X]E[Y].
- C(X,Y) = 0
- V(X + Y) = V(X) + V(Y)
Tog sedan fram väntevärdet och standardavvikelsen för
medelvärdet. Skrev sedan upp Stora talens lag. Avslutade kap 5 med
att definiera systematiskt fel och slumpmässigt fel och redogöra
för skillnaden mellan noggrannhet och precision. Inledde sedan
kapitel 6 om Normalfördelning med att skriva upp och rita upp
Normalfördelningens täthetsfunktion och Fördelningsfunktion.
Avslutade med att visa hur man kan transformera varje
Normalfördelning N(E[X],D[X]) till standardnormalfördelningen
N(0,1).
Tis 14 nov Började med att avsluta kapitel 4
med att som exempel på summa visa att summan av ober
Poisonfördelade stok.var. är Poissonfördelad.Började sedan med
kapitel 5 och startade med att berätta att väntevärdet är vad man
får i genomsnitt om man gör oändligt många försök. T.ex. blir ju
det genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan
exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog
sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter
variansen för X och standardavvikelsen D(X). Sedan använde jag mig
även här av ex 5.1 i boken för att räkna ut variansen m.h.a.
definitionen. Härledde sedan ur definitionen formeln
V(X)=E(X²)-(E(X))² och räknade till sist ut samma varians m.h.a.
denna formel. Definierade sedan även variationskoefficienten
R(X)=D(X)/E(X). Gick därefter igenom följande viktiga räkneregler
för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c
V(aX+b)=V(aX)=a²V(X) samt om X och Y är oberoende
V(X+Y)=V(X)+V(Y). Definierade sedan begreppet kovarians och visade
att V(X)=C(X,X). Definerade sedan begreppet
korrelationskoefficient och berättade om dess egenskaper. Visade
att om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y)
vilket i sin tur leder till att C(X,Y)=0, d.v.s. att X och Y är
okorrelerade. Visade sedan att omvändningen inte behöver vara sann
genom att göra exempel 5.13 i läroboken.
Ons 8 nov Började med att repetera begreppen
sannolikhetsfunktion, Fördelningsfunktion, och täthetsfunktion och
sambanden mellan dem.Tog sedan exempel 3.14 i läroboken som
exempel på en blandning av diskreta och kontinuerliga stokastiska
variabler. Fortsatte sedan med att gå igenom funktioner av
stokastiska variabler. Tog som exempel i det diskreta fallet
exempel 3.16 i läroboken och som exempel i det kontinuerliga
fallet exempel 3.19 och 3.20 i läroboken.Fortsatte sedan med att
gå igenom flerdimensionella diskreta ock kontinuerliga stokastiska
variabler och begreppen simultan sannolikhetsfunktion repektive
simultan täthetsfunktion och hur man ur dessa får fram den
marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade sedan hur man tar fram Fördelningsfunktionen för
max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för X
respektive Y.
Tis 7 nov Började med att repetera
begreppet stokastisk variabel och sannolikhetsfunktionerna för
För-första -gångenfördelningen och Binomialfördelningen. Gick
sedan igenom Hypergeometriska fördelningen. Fortsatte med att gå
igenom Poissonfördelningen.Kom sedan in på kontinuerlig stokastisk
variabel och definierade täthetsfunktionen och gick igenom hur man
ur den får fram Fördelningsfunktionen och vice versa.Gick därefter
igenom exponentialfördelningen. Fortsatte med att visa att tiden
mellan två händelser är exponentialfördelad om antalet händelser
är Poissonfördelat. Visade även att exponentialfördelningen saknar
minne.Gick sedan igenom den likformiga fördelningen och tog som
exempel på denna exempel 3.8 och exempel 3.9 i läroboken.Berättade
att eftersom hela kapitel 6 ägnas åt Normalfördelningen så gås den
igenom då.
Fre 3 nov Började med att repetera formeln för
betingad sannolikhet. Repeterade även lagen om total sannolikhet
m.h.a. Venndiagram. Tog sedan exempel 2.17 som exempel på denna.
Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som
exempel på denna. Visade sedan ex 2.20 på OH som en intressant
tillämpning av Bayes sats. Visade sedan definitionen för oberoende
utgående från betingningsformeln. Avslutade sedan kapitel 2 med
exempel 2.23 som exempel på oberoende.Började därefter kapitel 3
med att gå igenom igenom begreppet stokastisk variabel och
definera sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Definierade sedan
Fördelningsfunktionen och berättade om dess egenskaper. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick
sedan igenom ett antal viktiga diskreta fördelningar. Började med
tvåpunktsfördelningen och då speciellt Bernouillyfördelningen.
Fortsatte med den likformiga fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom binomialfördelningen.
;
Ons 1 nov Började med att repetera fallet
dragning med återläggning med hänsyn till ordning. Sedan tog jag
som exempel på dragning utan återläggning med hänsyn till
ordning en förening med 8 medlemmar som skulle välja
ordförande,sekreterare och kassör vilket ger 8ggr 7ggr 6
kombinationer .Allmänna fallet n!/(n-k)! kombinationer. Som
exempel på dragning utan återläggning utan hänsyn till ordning tog
jag antalet pokergivar som ju blir 52 över 5. Allmänt n över k
kombinationer Gick därefter igenom sannolikheten att vid n
dragningar utan återläggning utan hänsyn till ordning dra k vita
kulor från k vita och s svarta kulor. Utvidgade sedan detta
exempel på hypergeometrisk fördelning med ett exempel med tre
färger där sannolikheten att dra ett visst antal röda,gula och blå
kulor räknades ut. Fortsatte med att gå igenom sannolikheten
att vid n dragningar med återläggning utan hänsyn till ordning dra
k vita kulor från v vita och s svarta kulor. Utvidgade sedan detta
exempel på binomialfördelning till ett exempel på
multinomialfördelning där sannolikheten att dra ett visst antal
röda,gula och blå kulor räknades ut. Började sedan med betingad
sannolikhet. Illustrerade betingningsformeln m.h.a. exemplet på
sid 26 i läroboken. Avslutade med att visa lagen om total
sannolikhet m.h.a. Venndiagram.
Tis 31 okt Presenterade först kursens
hemsida som hittas på http://www.math.kth.se/matstat/gru/SF1910
och visade olika länkar och dess innehåll. Fortsatte sedan med att
ge exempel på olika användningsområden som ämnet matematisk
statistik har och som denna kurs ger en introduktion till. Började
sedan med att gå igenom utfall,utfallsrum,händelser. Förklarade
därefter skillnaden mellan diskret och kontinuerlig fördelning.
Tog övningsuppgift 2.1a och b som exempel på diskreta utfallsrum.
Gick sedan igenom snitt, union, komplement och visade hur man med
hjälp av Venndiagram räknar ut sannolikheter. Definierade i
samband med detta disjunkthet.Skrev upp Kolmogorovs axiomsystem
och den klassiska sannolikhetsdefinitionen.Resten av tiden ägnades
åt kombinatorik. Började med multiplikationsprincipen.Gick igenom
draging med återläggning med hänsyn till ordning och tog som
exempel att antal pinkoder blir 10^4 eftersom antal kombinationer
när man drar k ggr från n element blir n^k.
|