Aktuell information för kursen SF1923 Sannolikhetslära och statistik, 6hp,
för CMEDT2 och SF1935 Sannolikhetslära och statistik med
tillämpning inom maskininlärning, 7.5 hp, för CDATE2 period 4, VT
2025.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Laboration 2 fredag 16/5 kl 8-12
Lab 2 är frivillig. Den som har godkänt resultat på Lab 2 får
tillgodoräkna sig uppg 12 på ordinarie tentamen och första
omtentamen.
De som önskar redovisa Laboration 2 måste boka en
redovisningstid senast onsdag 14/5 kl 23.59 (se instruktionen
nedan).
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och öppna
Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av
labspecifikationen som ni har skrivit era personnummer på
förstasidan på. Denna utskrift undertecknar labassistenten
efter att han eller hon har godkänt labben och utskriften
fungerar sedan som ert kvitto på resultatet.
Instruktion om hur man anmäler sig till Lab 2
(Det finns 4 grupper per kvart, max ( och
helst) 2 studenter per grupp.) Gå in i kalender.
Klicka på "Hitta möte". Välj kurs. Klicka på "Lämna in".
Välj tid. Klicka på "Reservera".
Om ni är två personer i labbgruppen
- ENDAST en (av er två) ska skicka reservationen i Kalender
(i Kommentar till Reservationen kan ni däremot ange vilka ni
två som är i labbgruppen).
Övningsgrupp 1 är nedlagd
Kontrollskrivning
Kontrollskrivningen Torsdagen 10/4 kl 8-10 omfattar kap 2-5 i
kurslitteraturen.De studenter som får godkänt på
kontrollskrivningen får tillgodoräkna sig uppgift 1-3 på del I på
den ordinarie tentamen och på första omtentamenstillfället.
Kontrollskrivningen kommer att bestå av 5 uppgifter. För att få
godkänt krävs minst 3 rätt. Tillåtet hjälpmedel är miniräknare.
Datorlaborationer
Utöver föreläsningar och övningar innehåller kursen två
frivilliga datorlaborationer. Studenter som godkänts på den
andra av dessa laborationer får tillgodoräkna sig uppgift 12 på
del I och får dessutom 3 bonuspoäng på del II av den ordinarie
tentamen och det första omtentamenstillfället.
Laboration 1 är både en introduktion till hur
man använder MATLAB i sannolikhetsteori och statistik och en
förberedelse till den andra datorlaborationen.
Laboration 2 som är den bonusgrundande
datorlaborationen utförs i grupper om 2 studenter, men de
skriftliga förberedelseuppgifterna ska lösas individuellt.
Varje grupp kommer att få boka ett femton minuter långt
redovisningstillfälle i datorsal. Både de skriftliga
individuella förberedelseuppgifterna och
laborationsuppgifterna måste vara färdigställda före
redovisningstillfället fre 16/5 kl 8-12. Det kommer inte att
ges möjlighet till handledning i datorsal, men det finns
möjlighet att i begränsad omfattning fråga övningsledarna om
hjälp i samband med övningarna och föreläsaren i samband med
föreläsningarna.
Redovisningstillfällen för datorlaboration 2 kommer att bokas i
kalendern i Canvas och detaljerad information om hur detta görs
skickas ut under kursens gång efter kontrollskrivningen.
Syftet med datorlaborationerna är att ge en fördjupad
förståelse för de begrepp och den teori som tas upp i kursen och
samtliga studenter rekommenderas därför att delta på
datorlaborationerna.
Föreläsningar
Föreläsningarna kommer att ges på sal. Efter varje föreläsning
kommer det längst ner på denna sida under rubriken Föreläsningsdagbok
finnas en kort sammanfattning av vad som gåtts igenom på
varje föreläsning. Där finns även föreläsningsanteckningar som är
just anteckningar av varierande utförlighet och kvalitet.
Inspelade föreläsningar
Det finns också inspelade föreläsningar.De ligger på media gallery
på canvassidan. På sidan Videoföreläsningsdagbok
finns en dagbok där huvuddragen av respektive föreläsning
sammanfattats. Där står också hur lång respektive föreläsning är.
Kolla det innan ni börjar titta. Eftersom de är inspelade så är de
ibland utvidgade versioner av föreläsningarna jag håller på sal.
Detta beror på att jag inte har behövt bestämma mig för om jag ska
lägga dem på en nivå för de som bara vill ha godkänt eller på en
nivå för de som vill ha lite mer fördjupning utan jag gör både
och. Ljudet blir bättre om man använder hörlurar till sin laptop.
Övningar
Övningarna kommer att ges på sal. Även övningarna finns inspelade,
(men är inte identiska med de som ges i direkttid på sal även om
det oftast är samma uppgifter som gås igenom) och länkar till dem
finns under respektive övning på länken Övningsplan
, förutom övning 15 som ligger på media gallery på canvassidan.
Föreläsningsdagbok
Ons 16 apr Började med att repetera definitionen på konfidensintervall
och hur man mh.a. §12.1 i F.S. tar fram det tvåsidiga konfidensintervallet för väntevärdet när
mätdata kommer från en Normalfördelning där standardavvikelsen
är känd.Visade sedan
hur man enkelt får fram de ensidiga konfidensintervallen
när man har fått fram det tvåsidiga.
Visade därefter utgående från
konfidensintervallet för väntevärdet där standardavvikelsen är
känd hur det tvåsidiga konfidensintervallet för väntevärdet ser
ut när mätdata kommer från en Normalfördelning där
standardavvikelsen är okänd. Därefter visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är kända.
Sedan visades konfidensintervallet för skillnaden mellan
väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och lika och hur man m.h.a.§11.2
viktar ihop de två stickprovsvarianserna för att få en skattning
s av standardavvikelsen. Därefter visades hur man bildar ett
konfidensintervall med approximativ konfidensgrad för skillnaden
mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och olika. Därpå visades det
viktiga fallet när man har parvisa observationer-"stickprov i
par"- och att konfidensintervallet för väntevärdet av de parvisa
skillnaderna då tas fram som om man har ett stickprov av parvisa
skillnader. Fortsatte sedan med två gamla tentatal-januariitentan
2025 uppg 15a och marstentan 2024 uppg 14 som exempel
på skillnad mellan väntevärden respektive stickprov i par.
Visade i samband med detta också hur man tar fram
konfidensintervallet för µ om µ^*obs t.ex. är 2xmedel -ymedel.(Jfr
uppg 15b på januaritentan 2025.)
Tis 15 apr Började med att repetera begreppen
TÄTA,TÄTA*,TÄTA*obs. Gick sedan igenom Minsta-kvadrat-metoden. Som
exempel visades hur man kunde göra MK-skattningen av arean hos en
kvadrat där två mätdata var sidans längd, och ett mätdata var
diagonalens längd. Fortsatte med att gå igenom exempel 11.19 i
läroboken som exempel på hur Minsta-kvadrat-skattning går till när
två saker ska skattas. Definierade sedan begreppet konsistent
skattning. Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa. Avslutade
sedan kapitel 11 med att definiera begreppet medelfel och tog ett
par enkla exempel på detta. Inledde därefter kapitel 12 med att
definiera begreppen konfidensintervall och konfidensgrad i
allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd. Visade till sist
hur man får fram samma konfidensintervall genom att använda § 12.1
i Formelsamlingen.
Ons 9 apr Började med kapitel 10 och definierade
medelvärde, stickprovsvarians, populationsvarians,
variationskoefficient, median, kovarians och
korrelationskoefficient, begreppen grupperade data, absolut och
relativ frekvens, klassindelade data, och histogram. Avslutade
kapitel 10 med att gå igenom hur man gör en boxplott och visade i
samband med detta hur man tar fram kvartiler och percentiler.
Började sedan kap 11 med att redogöra för skillnaden mellan det
riktiga värdet TÄTA, stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning
hur man brukar skatta väntevärdet my och standardavvikelsen sigma
vid okänd fördelning. Tog sedan som ytterligare exempel på
skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i
Normalfördelningen.Presenterade till sist
Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken
som exempel på denna.
Tis 8 apr kl 13-15 Började kap 7 med Hypergeometriska
fördelningen och skrev upp dess sannolikhetsfunktion. Definierade
sedan Binomialfördelningen och skrev upp dess
sannolikhetsfunktion. Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N.
Visade sedan utgående från Bernoullifördelningen att villkoret
np(1-p)>10 för Normalapproximation av
Binomialfördelningen egentligen är ett C.G.S.-villkor. Gick sedan
igenom begreppet halvkorrektion. Gick därefter in
på Poissonfördelningen. Genom att kombinera satsen om att
summan av oberoende Poissonfördelade stokastiska variabler är
Poissonfördelad med att dela upp intervallet där X är
Poissonfördelad i många delintervall visades till sist att
villkoret µ>15 för normalapproximation
egentligen är ett C.G.S.-villkor. Avslutade sedan kap 7 med att
härleda hur sannolikhetsdefinitionen för Binomialfördelningen
övergår i sannolikhetsfunktionen för Poissonfördelningen om p är
litet, vilket motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np).
Tor 3 apr Började med att ta fram väntevärde och
standardavvikelse för medelväret av n st ober stokastiska
variabler. Fortsatte med att skriva upp att uppmätt värde =
korrekt värde+ systematiskt fel+ slumpmässigt fel, och att dålig
noggrannhet är det samma som stort systematiskt fel medan dålig
precision är det samma som stort slumpmässigt fel.Skrev sedan upp
Stora talens lag. Inledde sedan kap 6 med att skriva upp
täthetsfunktionen och fördelningsfunktionen för
Normalfördelningen. Skrev efter det upp täthetsfunktionen och
fördelningsfunktionen för standardiserade Normalfördelningen
N(0,1). Skrev sedan upp att om X är N(E[X],D[X]) så gäller att
Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man
använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X])
för k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används.
Avslutade med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2
används. Började sedan med att skriva upp att varje
linjärkombination av oberoende Normalfördelade stokastiska
varaibler är Normalfördelad. Räknade exempel 6.2a,b som exempel på
detta. Fortsatte med att med att gå igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt
Normalfördelad om n är stort och att detta även medför att
medelvärdet är approximativt Normalfördelat.
Tis 1 apr Började med att repetera definitioner och
begrepp från föregående föreläsning. Definierade även
variationskoefficienten R(X)=D(X)/E(X), och medianen xtilde som
definieras av att P(X<xtilde)=0.5. Gick sedan igenom följande
räkneregelför väntevärden: E(aX+bY+c)=aE(X)+bE(Y)+c. Härledde
sedan ur definitionen formeln V(X)=E(X²)-(E(X))². Efter detta
visades att V(aX+b)=V(aX)=a²V(X). Visade sedan genom ett enkelt
exempel att E(X²) nte är lika med (E(X))² i allmänhet. Definierade
sedan begreppet kovarians och och begreppet
korrelationskoefficient och berättade om dess egenskaper. Visade
också att V(X)=C(X,X). Gjorde sedan ex 5.13 i Blom för att visa
att X och Y kan vara okorrelerade utan att vara oberoende. Skrev
upp att om X och Y är oberoende så leder det till att
E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0 D.v.s. om
X och Y är oberoende så leder det alltid till att X och Y är
okorrelerade. Som övning på att räkna ut en kovarians gjorde jag
övningsuppgift 5.18. Visade också här att om X och Y är
okorrelerade behöver det inte leda till att X och Y är oberoende.
Gick sedan igenom räkneregler för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Sammanfattade därefter
med att upprepa följande viktiga räkneregler för väntevärden och
varianser: E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X
och Y är oberoende V(X+Y)=V(X)+V(Y).
Ons 26 mars Började kapitel 4 med att gå igenom
flerdimensionella diskreta och kontinuerliga stokastiska
variabler. Gick igenom begreppen simultan sannolikhetsfunktion
repektive simultan täthetsfunktion och hur man ur dessa får fram
den marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade också hur man räknar ut sannolikheter i det
två-dimensionella diskreta och kontinuerliga fallet. Tog som
exempel i kontinuerliga fallet uppg 14 på januaritentan 2024.
Fortsatte med att visa hur man tar fram Fördelningsfunktionen för
max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för X
respektive Y. Avslutade kapitel 4 med att som exempel på summa
visa att summan av ober Poisonfördelade stok.var. är
Poissonfördelad.Började sedan med kapitel 5 och startade med att
berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet av
ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken,och räknade
därigenom ut E(X). Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog
sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter
variansen V(X) och standardavvikelsen D(X). Sedan använde jag mig
även här av ex 5.1 i boken för att räkna ut variansen m.h.a.
definitionen. Härledde sedan ur definitionen formeln
V(X)=E(X²)-(E(X))².
Tis 25 mars Började med att gå igenom Poissonfördelningen
och skrev upp satsen som säger att summan av oberoende
Poissonfördelningar också är Poissonfördelad. Tog exempel 7.7 i
Blom som exempel på detta. Började sedan med kontinuerliga
stokastiska variabler. Definierade täthetsfunktionen och gick
igenom hur man ur den får fram Fördelningsfunktionen och vice
versa. Gick därefter igenom exponentialfördelningen. Fortsatte med
att visa att tiden mellan två händelser är exponentialfördelad om
antalet händelser är Poissonfördelat. Visade även att
exponentialfördelningen saknar minne. Berättade att eftersom hela
kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Gick
sedan igenom den likformiga fördelningen och tog som exempel på
denna exempel 3.9 i läroboken. Tog exempel 3.14 i läroboken som
exempel på en blandad fördelning av diskreta och kontinuerliga
stokastiska variabler. Avslutade kapitel 3 med att gå igenom
funktioner av stokastiska variabler. Började med att gå igenom det
diskreta fallet. Tog som exempel 3.16 i Blom. Gick sedan igenom
det kontinuerliga fallet. Tog som exempel 3.19 och 3.20 i Blom.
Fre 21 mars Började med att visa ex 2.20 som en
intressant tillämpning av Bayes sats. Fortsatte med att visa
definitionen för oberoende utgående från betingningsformeln. Tog
sedan exempel 2.23 som exempel på oberoende.Inledde sedan kapitel
3 med att gå igenom begreppet stokastisk variabel och definera
sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Definierade sedan
Fördelningsfunktionen och berättade om dess egenskaper. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick
sedan igenom ett antal viktiga diskreta fördelningar. Började med
tvåpunktsfördelningen och då speciellt Bernouillifördelningen.
Fortsatte med den likformiga fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen.Därefter gick jag igenom Binomialfördelningen.
Avslutade med att gå igenom hypergeometriska fördelningen.
Ons 19 mars Inledde kombinatoriken med
multiplikationsprincipen och den klassiska
sannolikhetsdefinitinen. Gick sedan igenom draging med
återläggning med hänsyn till ordning och tog som exempel att antal
pinkoder blir 10^4 eftersom antal kombinationer när man drar k ggr
från n element blir n^k. Som exempel på dragning utan återläggning
med hänsyn till ordning tog jag sedan en förening med 8 medlemmar
som skulle välja ordförande,sekreterare och kassör vilket ger 8
ggr 7 ggr 6 kombinationer. Allmänna fallet n!/(n-k)!
kombinationer. Gick sedan igenom dragning utan återläggning utan
hänsyn till ordning. Tog som exempel hur många pokergivar det
finns. 52!/(5! ggr 47!). D.v.s. 52 över 5 gånger. I allmänna
fallet har vi n över k kombinationer. Gick därefter igenom
sannolikheten att vid n dragningar utan återläggning utan hänsyn
till ordning dra k gula kulor från g gula och n-k blå kulor från b
blå. Utvidgade sedan detta till sannolikheten att dra k gula; l
blå och r röda o.s.v när man har f färger. Började sedan med
betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.
Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som
exempel på denna.
Tis 18 mars Presenterade först kursens hemsida och visade
olika länkar och dess innehåll. Fortsatte sedan med att ge exempel
på olika användningsområden som ämnet matematisk statistik har och
denna kurs ger en introduktion till. Började sedan med att gå
igenom utfall,utfallsrum,händelser.Förklarade därefter skillnaden
mellan diskret och kontinuerlig fördelning. Tog övningsuppgift
2.1a och b som exempel på diskreta utfallsrum. Gick sedan igenom
snitt, union, komplement och visade hur man med hjälp av
Venndiagram räknar ut sannolikheter. Definierade i samband med
detta disjunkthet.
|