Aktuell information för kursen
SF1923/SF1924 Sannolikhetslära och statistik, 6 hp, för
CMEDT,CDATE period 4, vt 2022.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Instruktion om hur man anmäler sig till lab2
Gå in på personer . Klicka på Lab2SF1923/SF1924VT22:1. Välj en grupp
1-80. Gå in i kalender. Klicka på "Hitta möte". Välj kurs. Klicka på
"Lämna in".Välj tid. Klicka på "Reservera".
Laboration 2
De som önskar redovisa Laboration 2 måste boka en redovisningstid
senast söndag 15/5 kl 23.59. Boka laborationstid genom att först
anmäla er till en av de 80 grupperna för Lab2SF1923/SF1924VT22:1
som finns under fliken Personer på Canvassidan. Boka sedan in er
grupp på ett av redovisningspassen i kalendern för SF1923/SF1924.
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och öppna
Matlab samt ta fram era redovisningsuppgifter.
Ha med er en utskrift av labspecifikationen som ni har skrivit
era personnummer på förstasidan på. Denna utskrift undertecknar
labassistenten efter att han eller hon har godkänt labben och
utskriften fungerar sedan som ert kvitto på resultatet.
Kontrollskrivning
Kontrollskrivningen onsdagen 13/4 kl 8-10 omfattar kap 2-5 i
kurslitteraturen.De studenter som får godkänt på kontrollskrivningen
får tillgodoräkna sig uppgift 1-3 på del I på den ordinarie tentamen
och på första omtentamenstillfället. Kontrollskrivningen kommer att
bestå av 5 uppgifter. För att få godkänt krävs minst 3 rätt.Tillåtet
hjälpmedel är miniräknare.
Datorlaborationer
Utöver föreläsningar och övningar innehåller kursen två
frivilliga datorlaborationer. Studenter som godkänts på den andra
av dessa laborationer får tillgodoräkna sig uppgift 12 på del I
och får dessutom 3 bonuspoäng på del II av den ordinarie tentamen
och det första omtentamenstillfället.
Laboration 1 är både en introduktion till hur
man använder MATLAB i sannolikhetsteori och statistik och en
förberedelse till den andra datorlaborationen. Det finns möjlighet
att få handledning på denna laboration under ett schemalagt
laborationspass.
Laboration 2 som är den bonusgrundande
datorlaborationen utförs i grupper om 2 studenter, men de
skriftliga förberedelseuppgifterna ska lösas individuellt. Varje
grupp kommer att få boka ett femton minuter långt
redovisningstillfälle i datorsal. Både de skriftliga
individuella förberedelseuppgifterna och laborationsuppgifterna
måste vara färdigställda före redovisningstillfället. Det kommer
inte att ges möjlighet till handledning i datorsal, men det
finns möjlighet att i begränsad omfattning fråga övningsledarna
om hjälp i samband med övningsundervisningen.
Redovisningstillfällen för datorlaboration 2 kommer att bokas i
kalendern i Canvas och detaljerad information om hur detta görs
skickas ut under kursens gång.
Syftet med datorlaborationerna är att ge en fördjupad förståelse
för de begrepp och den teori som tas upp i kursen och samtliga
studenter rekommenderas därför att delta på datorlaborationerna.
Föreläsningar
Föreläsningarna kommer att ges på sal. Efter varje föreläsning
kommer jag att längst ner på denna sida under rubriken Föreläsningsdagbok
skriva en kort sammanfattning av vad som gåtts igenom på
varje föreläsning. Där finns även föreläsningsanteckningar som är
just anteckningar av varierande utförlighet och kvalitet.
Inspelade föreläsningar
Det finns också inspelade föreläsningar.De ligger på media gallery
på canvassidan. På sidan Videoföreläsningsdagbok
finns en dagbok där huvuddragen av respektive föreläsning
sammanfattats. Där står också hur lång respektive föreläsning är.
Kolla det innan ni börjar titta. Eftersom de är inspelade så är de
ibland utvidgade versioner av föreläsningarna jag håller på sal.
Detta beror på att jag inte har behövt bestämma mig för om jag ska
lägga dem på en nivå för de som bara vill ha godkänt eller på en
nivå för de som vill ha lite mer fördjupning utan jag gör både och.
Ljudet blir bättre om man använder hörlurar till sin laptop.
Övningar
Övningarna kommer att ges på sal. Även övningarna finns inspelade,
(men är inte identiska med de som ges i direkttid på sal även om det
oftast är samma uppgifter som gås igenom) och länkar till dem finns
under respektive övning på länken Övningsplan
, förutom övning 15 som ligger på media gallery på canvassidan.
Formel och Tabellsamling på tentamen
På tentan kommer inte längre egen medhavd Formelsamling
och tabellsamling
i matematisk statistik längre att tillåtas som hjälpmedel. I stället
delas Formelsamling
och tabellsamling
i matematisk statistik ut vid själva tentamenstillfället och lämnas
sedan in igen av tentanden tillsammans med tentan.
BETA ej längre tillåtet hjälpmedel på tentan
På gamla tentor stod att BETA är tillåtet hjälpmedel på
tentan. Observera att BETA ej längre är tillåtet
hjälpmedel på tentan.
Föreläsningsdagbok
Mån 9 maj Avslutade avsnittet om linjär
regression med att skissa några exempel där man med hjälp av
residualanalys kan avgöra om det är troligt att y beror linjärt av x
eller inte. Började kap 13.6 med att berätta när test av given
fördelning används. Gav sedan en kortfattad bakgrund till att det
som benämns Q i §14.3 i Formelsamlingen kan anses vara approximativt
Chi-2fördelad. Tog som inledande exempel på test av given fördelning
uppgift 15 på januaritentan 2019. Nästan halva föreläsningen ägnades
sedan helt åt att grundligt gå igenom exempel 13.18 i läroboken som
exempel på test av given fördelning där man dels måste skatta minst
en parameter ur data (i detta fall µ) för att skatta p1,p2,..
pr, dels slå ihop grupper för att villkoret npistörre
än eller lika med 5 skall gälla för alla i. Berättade sedan om när
homogenitetstest används och tog som exempel på detta uppgift 5 på
augustitentan 2018. Berättade efter detta att man vid oberoendetest
kan använda sig av identiskt samma numerik som man gör vid
homogenitetstest. Visade uppgift 2 på exempeltentan som exempel
på detta.
Mån 2 maj Började med att fortsätta med hypotesprövning m.h.a.
konfidensintervallmetoden. Genom att använda exempel 13.8 gjorde jag
nu hypotesprövning i fallet ensidigt test, dels med
kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes
med olika värden på risknivån alfa och m.h.a. detta visades också i
vilket intervall p-värdet måste ligga. Gjorde sedan övningsuppgift
13.21a för att visa hur man tar fram styrkan hos ett test när man
har använt sig av konfidensintervallmetoden. Utifrån detta visades
även hur man tar fram styrkefunktionen - i detta fall h(delta) där
delta =myx-myy. Gick sedan igenom linjär
regression och visade att parametrarna alfa och beta skattas med
Minsta-kvadrat-metoden. Fortsatte med att visa hur man m.h.a.
nollhypotesen
H0 :beta =0 kan avgöra om man ska kasta x eller ej.
Avslutade med att gå igenom exempel 14.7a i läroboken som exempel på
hur man med hjälp av multipel regression går tillväga för att avgöra
vilka storheter xi man ska kasta eller inte när man
antagit att y beror av xi:na.
Fre 29 april Inledde med att avsluta kap 12 genom att först
härleda konfidensintervallet för standardavvikelsen och för
variansen utgående från att summan av kvadrerade N(0,1)-variabler
tillhör CHI2-fördelningen. Visade sedan hur man tar framm dessa
konfidensintervall m.h.a. §12.4. Inledde sedan kap 13 med att skriva
upp en lista på viktiga definitioner och begrepp som används inom
hypotesprövning, såsom nollhypotes,mothypotes, risknivå, p-värde,
och styrka.Gick därefter igenom exempel 13.1 i läroboken som exempel
på ett fall där man inte använder konfidensintervall för att testa
sin nollhypotes och använde exempel 13.1 för att konkretisera
begreppen nollhypotes,mothypotes, risknivå, och p-värde . Fortsatte
därefter med exempel 13.4 i läroboken, där man tar fram styrkan hos
testet i exempel 13.1 för alternativet p=0.9, och tog även fram
styrkefunktionen h(p) i detta fall. Började sedan med exempel 13.8
och gjorde hypotesprövning i fallet tvåsidigt test, dels med
konfidensintervallmetoden dels med testvariabelmetoden. Detta
gjordes med olika värden på risknivån alfa och m.h.a. detta visades
också i vilket intervall p-värdet måste ligga.
Tor 28 april Började med att snabbt repetera hur man tar
fram det tvåsidiga konfidensintervallet för väntevärdet när mätdata
kommer från en Normalfördelning där standardavvikelsen är känd,
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är kända samt
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är okänd. Därefter visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
lika och hur man m.h.a.§11.2 viktar ihop de två
stickprovsvarianserna för att få en skattning s av
standardavvikelsen. Efter detta visades det viktiga fallet när man
har parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa skillnader. Sedan
visades hur man bildar ett konfidensintervall med approximativ
konfidensgrad för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
olika. Visade därefter att om stickproven är så stora så att C.G.S.
kan användas, så kan man bilda konfidensintervall med approximativ
konfidensgrad för väntevärden och skillnader mellan väntevärden även
om observationerna inte kommer från en Normalfördelning. Visade
sedan konfidensintervall med approximativ konfidensgrad för p när X
tillhör Bin(n,p),; för py- px när Y tillhör Bin(ny,py) och X tillhör
Bin(nx,px) samt för my i Poisson-fördelningen och att det i alla
dessa fall förutsätter att Normalapproximation är möjlig enligt §5.
Mån 25 april Började med att skriva upp vad man
sammanfattningsvis skall kunna från kap 11: begreppen TÄTA,TÄTA*
,TÄTA*obs, Minsta-kvadrat-metoden, Maximum-Likelihood-metoden,
begreppen väntevärdesriktighet, effektivitet och medelfel. Gick
därefter igenom begreppet medelfel och tog ett par enkla exempel på
detta. Definierade sedan begreppen konfidensintervall och
konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd, och visade då även
hur man får fram samma konfidensintervall genom att använda § 12.1 i
Formelsamlingen. Visade även hur man utgående från tvåsidiga
konfidensintervall generellt bildar ensidigt nedåt begränsade och
ensidigt uppåt begränsade konfidensintervall. Därefter visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är kända. Visade
avslutningsvis utgående från det första konfidensintervallet för
väntevärdet där mätdata kommer från en Normalfördelning där
standardavvikelsen är känd hur det tvåsidiga konfidensintervallet
för väntevärdet ser ut när mätdata kommer från en Normalfördelning
där standardavvikelsen är okänd.
Ons 13 apr Började med att repetera begreppen TÄTA,TÄTA*
,TÄTA*obs. Repeterade även som exempel på skattning hur man brukar
skatta väntevärdet my och standardavvikelsen sigma vid okänd
fördelning. Tog sedan som ytterligare exempel på skattningar hur man
skattar p i Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i
Normalfördelningen.Definerade därefter begreppen
väntevärdesriktighet och effektivitet och tog ett par enkla exempel
på dessa. Definierade även begreppet konsistens. Presenterade sedan
Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken som
exempel på denna. Fortsatte med att gå igenom
Minsta-kvadrat-metoden. Som exempel visades hur man kunde göra
MK-skattningen av arean hos en kvadrat där 2 mätdata var sidans
längd, och 1 mätdata var diagonalens längd Tog sedan exempel 11.19 i
läroboken som exempel på hur Minsta-kvadrat-skattning går till när
två saker ska skattas.
Mån 11 apr Började med att gå igenom när
Poissonfördelningen uppträder. Genom att kombinera satsen om att
summan av oberoende Poissonfördelade stokastiska variabler är
Poissonfördelad med att dela upp intervallet där X är
Poissonfördelad i många delintervall visades sedan att
villkoret µ>15 för normalapproximation
egentligen är ett C.G.S.-villkor. Avslutade kap 7 med att härleda
hur sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet, vilket
motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np).
Fortsatte sedan med kapitel 10 och definierade medelvärde,
stickprovsvarians, populationsvarians, variationskoefficient,
median, kovarians och korrelationskoefficient, begreppen grupperade
data, absolut och relativ frekvens, klassindelade data, histogram
och boxplott. Avslutade kapitel 10 med att visa hur man tar fram
kvartiler och percentiler.
Började sedan kap 11 med att redogöra för skillnaden mellan
det riktiga värdet TÄTA, stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning
hur man brukar skatta väntevärdet my och standardavvikelsen sigma
vid okänd fördelning. Tog till sist som ytterligare exempel på
skattningar hur man skattar p i Binomialfördelningen,och my i
Poissonfördelningen.
Fre 8 apr Började med att gå igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt normalfördelad
om n är stort, och att detta även medför att medelvärdet är
approximativt normalfördelat. Avslutade kapitel 6 med att göra
exempel 6.6 i Blom som exempel på Centrala Gränsvärdessatsen.
Inledde kap 7 med att skriva upp §6 på tavlan. Definierade sedan
Hypergeometriska fördelningen och skrev upp dess
sannolikhetsfunktion. Definierade sedan Binomialfördelningen och
skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~
Bin(n,p) om n/N<0.1. Visade sedan utgående från
Bernoullifördelningen att
villkoret np(1-p)>10 för Normalapproximation egentligen är
ett C.G.S.-villkor. Avslutade med att gå igenom halvkorrektion.
Tis 5 apr Började med att gå igenom beviset för Markovs
olikhet. Använde sedan Markovs olikhet för att bevisa Stora talens
lag och Tjebysjevs olikhet. Skrev sedan upp täthetsfunktionen och
fördelningsfunktionen för normalfördelningen. Skrev efter det upp
täthetsfunktionen och fördelningsfunktionen för standardiserade
normalfördelningen N(0,1). Skrev sedan upp att om X är N(E[X],D[X])
så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och
hur man använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för
k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och
nämnde sedan även sannolikheten för att ett utfall hamnar minst tre
standardavvikelser ifrån väntevärdet. Avslutade med att ta fram k
när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell
2 används. Skrev upp att varje linjärkombination av oberoende
N-fördelade stokastiska variabler är normalfördelad Räknade till
sist exempel 6.2a,b som exempel på detta.
Fre 1 apr Började med att repetera definitionerna för
väntevärde och varians i det diskreta och det kontinuerliga fallet i
en dimension. Gick sedan över till två dimensioner och definierade
E[g(X,Y)] i det diskreta och det kontinuerliga fallet. Definierade
sedan begreppet kovarians och visade att V(X)=C(X,X). Definerade
sedan begreppet korrelationskoefficient och berättade om dess
egenskaper. Visade att om X och Y är oberoende så leder det till att
E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0, d.v.s. att
X och Y är okorrelerade. Visade sedan att omvändningen inte behöver
vara sann genom att göra exempel 5.13 i läroboken. Som övning på att
räkna ut en kovarians gjorde jag sedan övningsuppgift 5.18. Gick
sedan igenom räkneregler för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Gick därefter igenom
följande viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är
oberoende V(X+Y)=V(X)+V(Y). Fortsatte med att ta fram väntevärde och
standardavvikelse för medelväret av n st ober stokastiska variabler.
Avslutade med att skriva upp att uppmätt värde = korrekt värde+
systematiskt fel+ slumpmässigt fel, och att dålig noggrannhet är det
samma som stort systematiskt fel medan dålig precision är det samma
som stort slumpmässigt fel.
Ons 30 mars Började med att gå igenom flerdimensionella
diskreta och kontinuerliga stokastiska variabler. Gick igenom
begreppen simultan sannolikhetsfunktion repektive simultan
täthetsfunktion och hur man ur dessa får fram den marginella
sannolikhetsfunktionen respektive den marginella täthetsfunktionen
och hur man vid oberoende även kan gå åt andra hållet. Visade sedan
hur man räknar ut sannolikheter i det två-dimensionella diskreta och
kontinuerliga fallet. Fortsatte med att visa hur man tar fram
Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående från
Fördelningsfunktionerna för X respektive Y. Avslutade kapitel 4 med
att som exempel på summa visa att summan av ober Poisonfördelade
stok.var. är Poissonfördelad.Började med kapitel 5 och startade med
att berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet av
ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev sedan
upp definitionen för E(X) resp. E(g(X)) i det diskreta fallet och
det kontinuerliga fallet. Tog sedan och räknade ut E(X²) i Ex. 5.1 i
boken. Definierade därefter variansen V(X) och standardavvikelsen
D(X). Sedan använde jag mig även här av ex 5.1 i boken för att räkna
ut variansen m.h.a. definitionen. Härledde sedan ur definitionen
formeln V(X)=E(X²)-(E(X))² och räknade ut samma varians m.h.a. denna
formel. Definierade avslutningsvis variationskoefficienten
R(X)=D(X)/E(X), och medianen xtilde som definieras av att
P(X<xtilde)=0.5.
Mån 28 mar Började med kontinuerliga stokastiska variabler.
Definierade täthetsfunktionen och gick igenom hur man ur den får
fram Fördelningsfunktionen och vice versa. Gick därefter igenom
exponentialfördelningen.Fortsatte med att visa att tiden mellan två
händelser är exponentialfördelad om antalet händelser är
Poissonfördelat. Visade även att exponentialfördelningen saknar
minne.Berättade att eftersom hela kapitel 6 ägnas åt
Normalfördelningen gås den igenom då. Gick sedan igenom den
likformiga fördelningen och tog som exempel på denna exempel 3.8 och
exempel 3.9 i läroboken. Tog sedan exempel 3.14 i läroboken som
exempel på en blandad fördelning av diskreta och kontinuerliga
stokastiska variabler. Fortsatte sedan med att gå igenom funktioner
av stokastiska variabler. Tog som exempel i det diskreta fallet
exempel 3.16 i Blom och som kontinuerliga exempel gjorde jag exempel
3.19 och 3.20 i Blom.
Fre 25 mar Började med att räkna ex 2.20 som en intressant
tillämpning av Bayes sats. Inledde sedan kapitel 3 med att gå igenom
begreppet stokastisk variabel och definera sannolikhetsfunktionen.
Tog som exempel på denna ex 3.1 i läroboken och ritade även upp
stolpdiagrammet. Definierade sedan Fördelningsfunktionen och
berättade om dess egenskaper. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp den. Gick sedan igenom ett antal
viktiga diskreta fördelningar. Började med tvåpunktsfördelningen och
då speciellt Bernouillifördelningen. Fortsatte med den likformiga
fördelningen och För-första-gången-fördelningen och den snarlika
geometriska fördelningen. Avslutade med att gå igenom
Binomialfördelningen, Hypergeometriska fördelningen och
Poissonfördelningen.
Ons 23 mar Började med att repetera fallet dragning med
återläggning med hänsyn till ordning. Som exempel på dragning utan
återläggning med hänsyn till ordning tog jag sedan en förening med 8
medlemmar som skulle välja ordförande,sekreterare och kassör vilket
ger 8ggr 7ggr 6 kombinationer. Allmänna fallet n!/(n-k)!
kombinationer.
Gick sedan igenom fallet dragning utan återläggning utan hänsyn till
ordning.Tog som exempel hur många pokergivar det finns.
52!/(5!ggr47!). D.v.s. 52 över 5 gånger. I allmänna fallet har vi n
över k kombinationer. Gick därefter igenom sannolikheten att
vid n dragningar utan återläggning utan hänsyn till ordning dra k
röda kulor från b blå och r röda kulor. Utvidgade sedan detta till
sannolikheten att dra k blå och l röda och m gula vid n dragningar
utan återläggning utan hänsyn till ordning från r röda b blå och g
gula kulor. Började sedan med betingad sannolikhet. Illustrerade
betingningsformeln m.h.a. exemplet på sid 26 i läroboken. Visade
lagen om total sannolikhet m.h.a. Venndiagram och tog exempel 2.17
som exempel på denna. Visade även Bayes sats m.h.a. Venndiagram och
tog exempel 2.19 som exempel på denna. Visade sedan definitionen för
oberoende utgående från betingningsformeln. Avslutade med exempel
2.23 som exempel på oberoende.
Mån 21 mar Började med att ge exempel på olika
användningsområden som ämnet matematisk statistik har och denna kurs
ger en introduktion till.Presenterade sedan kursens hemsida som
hittas på http://www.math.kth.se/matstat/gru och visa olika länkar
och dess innehåll. Började sedan med att gå igenom
utfall,utfallsrum,händelser. Gick sedan igenom snitt, union,
komplement och visade hur man med hjälp av Venndiagram räknar ut
sannolikheter. Definierade i samband med detta disjunkthet.Skrev upp
Kolmogorovs axiomsystem.Förklarade därefter skillnaden mellan
diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b
som exempel på diskreta utfallsrum. Hann sedan börja med
kombinatoriken. Började med multiplikationsprincipen och den
klassiska sannolikhetsdefinitinen. Gick igenom draging med
återläggning med hänsyn till ordning och tog som exempel att antal
pinkoder blir 10^4 eftersom antal kombinationer när man drar k ggr
från n element blir n^k.
|