Aktuell information för kursen
SF1910/SF1925 Tillämpad statistik, 7.5hp, för CSAMH,CLGYM period
2, ht 2022.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Laboration 2 fredag 16/12 kl 13-17
De som önskar redovisa Laboration 2 måste boka en
redovisningstid senast onsdag 14/12 kl 23.59 (se instruktionen
nedan).
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och
öppna Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av
labspecifikationen som ni har skrivit era personnummer på
förstasidan på. Denna utskrift undertecknar labassistenten
efter att han eller hon har godkänt labben och utskriften
fungerar sedan som ert kvitto på resultatet.
Hur man anmäler sig till lab 2
Gå in på personer. Välj en grupp 1- 64.(Det finns 4 grupper
per kvart, 2 studenter per grupp.) Gå in i kalender. Klicka på
"Hitta möte". Välj kurs. Klicka på "Lämna in". Välj tid. Klicka
på "Reservera".
Tider och sal för Räknestugorna
Tor 1 dec kl 10-12, sal W25
Tor 8 dec kl 10-12, sal W25
Tor 15 dec kl 10-12, sal W25
Kontrollskrivning
Kontrollskrivningen Onsdagen 23/11 kl 8-10 omfattar kap 2-5 i
kurslitteraturen.De studenter som får godkänt på
kontrollskrivningen får tillgodoräkna sig uppgift 1-3 på del I på
den ordinarie tentamen och på första omtentamenstillfället.
Kontrollskrivningen kommer att bestå av 5 uppgifter. För att få
godkänt krävs minst 3 rätt.Tillåtet hjälpmedel är miniräknare.
Datorlaborationer
Utöver föreläsningar och övningar innehåller kursen två
frivilliga datorlaborationer. Studenter som godkänts på den
andra av dessa laborationer får tillgodoräkna sig uppgift 12 på
del I och får dessutom 3 bonuspoäng på del II av den ordinarie
tentamen och det första omtentamenstillfället.
Laboration 1 är både en introduktion till hur
man använder MATLAB i sannolikhetsteori och statistik och en
förberedelse till den andra datorlaborationen. Det finns
möjlighet att få handledning på denna laboration under ett
schemalagt laborationspass.
Laboration 2 som är den bonusgrundande
datorlaborationen utförs i grupper om 2 studenter, men de
skriftliga förberedelseuppgifterna ska lösas individuellt.
Varje grupp kommer att få boka ett femton minuter långt
redovisningstillfälle i datorsal. Både de skriftliga
individuella förberedelseuppgifterna och
laborationsuppgifterna måste vara färdigställda före
redovisningstillfället. Det kommer inte att ges möjlighet till
handledning i datorsal, men det finns möjlighet att i
begränsad omfattning fråga övningsledarna om hjälp i samband
med övningsundervisningen.
Redovisningstillfällen för datorlaboration 2 kommer att bokas i
kalendern i Canvas och detaljerad information om hur detta görs
skickas ut under kursens gång.
Syftet med datorlaborationerna är att ge en fördjupad
förståelse för de begrepp och den teori som tas upp i kursen och
samtliga studenter rekommenderas därför att delta på
datorlaborationerna.
Föreläsningar
Föreläsningarna kommer att ges på sal. Efter varje föreläsning
kommer jag att längst ner på denna sida under rubriken Föreläsningsdagbok
skriva en kort sammanfattning av vad som gåtts igenom på
varje föreläsning. Där finns även föreläsningsanteckningar som är
just anteckningar av varierande utförlighet och kvalitet.
Inspelade föreläsningar
Det finns också inspelade föreläsningar.De ligger på media gallery
på canvassidan. På sidan Videoföreläsningsdagbok
finns en dagbok där huvuddragen av respektive föreläsning
sammanfattats. Där står också hur lång respektive föreläsning är.
Kolla det innan ni börjar titta. Eftersom de är inspelade så är de
ibland utvidgade versioner av föreläsningarna jag håller på sal.
Detta beror på att jag inte har behövt bestämma mig för om jag ska
lägga dem på en nivå för de som bara vill ha godkänt eller på en
nivå för de som vill ha lite mer fördjupning utan jag gör både
och. Ljudet blir bättre om man använder hörlurar till sin laptop.
Övningar
Övningarna kommer att ges på sal. Även övningarna finns inspelade,
(men är inte identiska med de som ges i direkttid på sal och på
zoom även om det oftast är samma uppgifter som gås igenom) och
länkar till dem finns under respektive övning på länken Övningsplan
, förutom övning 15 som ligger på media gallery på canvassidan.
Formel och Tabellsamling på tentamen
På tentan kommer inte längre egen medhavd Formelsamling
och tabellsamling
i matematisk statistik längre att tillåtas som hjälpmedel. I
stället delas Formelsamling
och tabellsamling
i matematisk statistik ut vid själva tentamenstillfället och
lämnas sedan in igen av tentanden tillsammans med tentan.
BETA ej längre tillåtet hjälpmedel på tentan
På gamla tentor stod att BETA är tillåtet hjälpmedel på
tentan. Observera att BETA ej längre är tillåtet
hjälpmedel på tentan.
Föreläsningsdagbok
Mån 12 dec Började med att berätta när CHI-2-test
används och tog som inledande exempel på detta uppgift 15 på
tentan 8 januari 2019. Första timmen ägnades sedan helt åt att
grundligt gå igenom exempel 13.18 i läroboken som exempel på test
av given fördelning där man dels måste skatta minst en parameter
ur data (i detta fall µ) för att skatta p1,p2,..
pr, dels slå ihop grupper för att villkoret npi
> 5 skall gälla för alla i. Berättade sedan om när
homogenitetstest används och tog som exempel på detta uppgift 5 på
tentan 13 augusti 2018. Berättade efter detta att man vid
oberoendetest kan använda sig av identiskt samma numerik som man
gör vid homogenitetstest. Visade uppgift 2 på exempeltentan som
exempel på detta.
Tor 8 dec Genom att använda exempel 13.8 repeterade jag
hypotesprövning i fallet ensidigt test, med
kofidensintervallmetoden. Fortsatte sedan med hypotesprövning i
fallet ensidigt test, med testvariabelmetoden. Detta gjordes med
olika värden på risknivån alfa och m.h.a. detta visades också i
vilket intervall p-värdet måste ligga. Gjorde sedan övningsuppgift
13.21a för att visa hur man tar fram styrkan hos ett test när man
har använt sig av konfidensintervallmetoden. Utifrån detta visades
även hur man tar fram styrkefunktionen - i detta fall h(delta) där
delta =myx-myy. Gick sedan igenom linjär
regression och visade att parametrarna alfa och beta skattas med
Minsta-kvadrat-metoden. Fortsatte med att visa hur man m.h.a.
nollhypotesen
H0 :beta =0 kan avgöra om man ska kasta x eller ej.
Skissade även ett exempel där man med hjälp av residualanalys kan
avgöra huruvida det är troligt att y beror linjärt av x. Avslutade
med att på en filmduk visa och gå igenom övningsuppgift 14.7 a)
som exempel på detta.
Tis 6 dec Inledde med att skriva upp en lista på
viktiga definitioner och begrepp som används inom hypotesprövning,
såsom nollhypotes,mothypotes, risknivå, p-värde, och styrka.Gick
därefter igenom exempel 13.1 i läroboken som exempel på ett fall
där man inte använder konfidensintervall för att testa sin
nollhypotes och använde exempel 13.1 för att konkretisera
begreppen nollhypotes,mothypotes, risknivå, och p-värde .
Fortsatte därefter med exempel 13.4 i läroboken, där man tar fram
styrkan hos testet i exempel 13.1 för alternativet p=0.9, och tog
även fram styrkefunktionen h(p) i detta fall. Började sedan med
exempel 13.8 och gjorde hypotesprövning i fallet tvåsidigt test,
dels med konfidensintervallmetoden dels med testvariabelmetoden.
Detta gjordes med olika värden på risknivån alfa och m.h.a. detta
visades också i vilket intervall p-värdet måste ligga. Genom att
använda exempel 13.8 gjorde jag avslutningsvis hypotesprövning i
fallet ensidigt test med kofidensintervallmetoden. Detta gjordes
också här med olika värden på risknivån alfa och m.h.a. detta
visades också här i vilket intervall p-värdet måste ligga.
Fre 2 dec Började med att gå igenom det viktiga fallet när
man har parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa skillnader. Som
exempel på "Skillnad mellan stickprov" visades tentatal
2019-06-05:15 och som exempel på "Stickprov i par" visades
tentatal 2019-08-12:15. Härledde sedan konfidensintervallet för
variansen. Tog därefter fram konfidensintervallet för
standardavvikelsen utgående från §12.4 i Formelsamlingen. Visade
utgående från detta konfidensintervall hur konfidensintervallet
för variansen ser ut. Visade också utgående från det tvåsidiga
konfidensintervallet för variansen hur man tar fram det
ensidiga.Gick sedan igenom konfidensintervall med approximativ
konfidensgrad där §12.3 används. Visade att om stickproven är så
stora så att C.G.S. kan användas, så kan man bilda
konfidensintervall med approximativ konfidensgrad för väntevärden
och skillnader mellan väntevärden även om observationerna inte
kommer från en Normalfördelning. Avslutade kapitel 12 med att visa
konfidensintervall med approximativ konfidensgrad för p när X
tillhör Bin(n,p), för py- px när Y tillhör Bin(ny,py) och X
tillhör Bin(nx,px) samt för my i Poisson-fördelningen och att det
i alla dessa fall förutsätter att Normalapproximation är möjlig
enligt villkoren i §5 respektive §6.
Tor 1 dec Inledde med att definiera begreppet medelfel och
tog som exempel på detta skattningen av väntevärdet med
medelvärdet,skattningen av andelen p i Binomialfördelningen och
skattningen av my i Poissonfördelningen.Avslutade kapitel 11 med
att definiera begreppet konsistens.Inledde kapitel 12 med att
definiera begreppen konfidensintervall och konfidensgrad i
allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd.Visade också hur
man får samma konfidensintervall m.h.a.§12.1. Visade utgående från
detta exempel hur man generellt bildar ensidigt nedåt begränsade
och ensidigt uppåt begränsade konfidensintervall. Visade sedan
m.h.a. §12.2 hur det tvåsidiga konfidensintervallet för
väntevärdet ser ut när mätdata kommer från en Normalfördelning där
standardavvikelsen är okänd. Visade sedan m.h.a §12.1 och §11.3
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är kända. Sedan
visades hur man m.h.a.§12.3 bildar ett konfidensintervall med
approximativ konfidensgrad för skillnaden mellan väntevärdena hos
två Normalfördelade stickprov där standardavvikelserna är okända
och olika. Därefter visades m.h.a.§12.2 konfidensintervallet för
skillnaden mellan väntevärdena hos två Normalfördelade stickprov
där standardavvikelserna är okända och lika och hur man m.h.a.
§11.2 viktar ihop de två stickprovsvarianserna för att få en
skattning s av standardavvikelsen.
Mån 28 nov Började kap 11 med att redogöra för skillnaden
mellan det riktiga värdet TÄTA, stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning
hur man brukar skatta väntevärdet my och standardavvikelsen sigma
vid okänd fördelning. Tog sedan ytterligare exempel på skattningar
hur man brukar skatta p i Binomialfördelningen,Hypergeometriska
fördelningen och ffg-fördelningen,my i Poissonfördelningen, lambda
i exponentialfördelningen samt my och sigma i Normalfördelningen.
Presenterade sedan Maximum-Likelihood-metoden och räknade exempel
11.10 i läroboken som exempel på denna. Fortsatte med att gå
igenom Minsta-kvadrat-metoden. Som exempel visades hur man kunde
göra MK-skattningen av arean hos en kvadrat där två mätdata var
sidans längd, och ett mätdata var diagonalens längd Tog sedan
exempel 11.19 i läroboken som exempel på hur
Minsta-kvadrat-skattning går till när två saker ska skattas.
Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa.
Tor 24 nov Började med att avsluta kap 7 genom att visa hur
sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet,
vilket motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np). Berättade också att man kan approximera
Poissonfördelningen till Normalfördelningen om ?>15.
(I slutet på videoföreläsning 8 kan man se följande: 1)Genom att
kombinera satsen om att summan av oberoende Poissonfördelade
stokastiska variabler är Poissonfördelad med att dela upp
intervallet där X är Poissonfördelad i många delintervall visas
att villkoret µ>15 för
normalapproximation egentligen är ett C.G.S.-villkor.
2) Härledningen för hur sannolikhetsdefinitionen för
Binomialfördelningen övergår i sannolikhetsfunktionen för
Poissonfördelningen om p är litet, vilket motiverar att om p<0.1
så gäller att Bin(n,p)~Po(np). )
Började sedan med kap 10 och definierade medelvärde,
stickprovsvarians, populationsvarians, variationskoefficient,
median, kovarians och korrelationskoefficient. Gick sedan igenom
begreppen grupperade data,absolut och relativ frekvens,
klassindelade data,histogram och boxplott.Avslutade kapitel 10 med
att visa hur man tar fram kvartiler och percentiler.Fortsatte
sedan med att skriva upp en lista på viktiga definitioner och
begrepp som används inom hypotesprövning såsom
nollhypotes,mothypotes, risknivå, och p-värde.Gick sedan väldigt
snabbt igenom linjär regression. Visade sedan hur man i multipel
regression m.h.a. nollhypotesen H0 : beta i
=0 kan avgöra om man ska kasta respektive oberoende variabel xi
eller ej.
(För en utförligare genomgång av multipel regression-och som
exempel på detta övningsuppgift 14.7- se media gallery:
ljudforelasning 14 1 tim och 23 min och framåt. Linjär regression
börjar vid tiden 1:06)
Mån 21 nov Började med att gå igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort, och att detta även medför att
medelvärdet är approximativt normalfördelat. Avslutade kapitel 6
med att göra exempel 6.6 i Blom som exempel på Centrala
Gränsvärdessatsen. Inledde kap 7 med att skriva upp §6 på tavlan.
Definierade sedan Hypergeometriska fördelningen och skrev upp dess
sannolikhetsfunktion. Definierade sedan Binomialfördelningen och
skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~
Bin(n,p) om n/N<0.1. Visade sedan utgående från
Bernoullifördelningen att villkoret np(1-p)>10 för
Normalapproximation egentligen är ett C.G.S.-villkor. Gick sedan
igenom halvkorrektion. Avslutade med att gå igenom uppgift 2 på
augustitentan 2017 som exempel på Centrala Gränsvärdessatsen och
halvkorrektion.
Fre 18 nov Började med att gå igenom beviset för Markov s
olikhet. Använde sedan Markovs olikhet för att bevisa Stora talens
lag och Tjebysjevs olikhet. Skrev sedan upp täthetsfunktionen och
fördelningsfunktionen för normalfördelningen. Skrev efter det upp
täthetsfunktionen och fördelningsfunktionen för standardiserade
normalfördelningen N(0,1). Skrev sedan upp att om X är
N(E[X],D[X]) så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade
sedan om när och hur man använder Tabell 1 och Tabell 2 i
formelsamlingen och vad alfa-kvantilen är. Tog fram P(E[X]-kD[X]
< X < E[X]+kD[X]) för k=2 när X är N(E[X],D[X]) som exempel
på hur Tabell 1 används, och nämnde sedan även sannolikheten för
att ett utfall hamnar minst tre standardavvikelser ifrån
väntevärdet. Avslutade med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.99 som exempel på hur Tabell 2
används. Skrev upp att varje linjärkombination av oberoende
N-fördelade stokastiska variabler är normalfördelad Räknade till
sist exempel 6.2a,b som exempel på detta.
Tis 15 nov Började med att repetera definitionerna för
väntevärde och varians i det diskreta och det kontinuerliga fallet
i en dimension. Gick sedan över till två dimensioner och
definierade E[g(X,Y)] i det diskreta och det kontinuerliga fallet.
Definierade sedan begreppet kovarians och visade att V(X)=C(X,X).
Definerade sedan begreppet korrelationskoefficient och berättade
om dess egenskaper. Visade att om X och Y är oberoende så leder
det till att E(XY)=E(X)E(Y) vilket i sin tur leder till att
C(X,Y)=0, d.v.s. att X och Y är okorrelerade. Visade sedan att
omvändningen inte behöver vara sann genom att göra exempel 5.13 i
läroboken. Gick sedan igenom räkneregler för kovarianser och skrev
upp att C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket
bl.a. leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y)
och att V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Gick därefter
igenom följande viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är
oberoende V(X+Y)=V(X)+V(Y). Fortsatte med att ta fram väntevärde
och standardavvikelse för medelväret av n st ober stokastiska
variabler. Skrev sedan upp att uppmätt värde = korrekt värde+
systematiskt fel+ slumpmässigt fel, och att dålig noggrannhet är
det samma som stort systematiskt fel medan dålig precision är det
samma som stort slumpmässigt fel. Som övning på att räkna ut en
kovarians gjorde jag till sist övningsuppgift 5.18.
Ons 9 nov Började med att gå igenom flerdimensionella
diskreta och kontinuerliga stokastiska variabler. Gick igenom
begreppen simultan sannolikhetsfunktion repektive simultan
täthetsfunktion och hur man ur dessa får fram den marginella
sannolikhetsfunktionen respektive den marginella täthetsfunktionen
och hur man vid oberoende även kan gå åt andra hållet. Visade
sedan hur man räknar ut sannolikheter i det två-dimensionella
diskreta och kontinuerliga fallet. Fortsatte med att visa hur man
tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående
från Fördelningsfunktionerna för X respektive Y. Avslutade kapitel
4 med att som exempel på summa visa att summan av ober
Poisonfördelade stok.var. är Poissonfördelad.Började med kapitel 5
och startade med att berätta att väntevärdet är vad man får i
genomsnitt om man gör oändligt många försök. T.ex. blir ju det
genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan
exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog
sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter
variansen V(X) och standardavvikelsen D(X). Sedan använde jag mig
även här av ex 5.1 i boken för att räkna ut variansen m.h.a.
definitionen. Härledde sedan ur definitionen formeln
V(X)=E(X²)-(E(X))² och räknade ut samma varians m.h.a. denna
formel. Definierade avslutningsvis variationskoefficienten
R(X)=D(X)/E(X), och medianen xtilde som definieras av att
P(X<xtilde)=0.5.
Mån 7 nov Inledde med att gå igenom Poissonfördelningen och
skrev upp satsen som säger att summan av oberoende
Poissonfördelningar också är Poissonfördelad. Tog exempel 7.7 i
Blom som exempel på detta. Började sedan med kontinuerliga
stokastiska variabler. Definierade täthetsfunktionen och gick
igenom hur man ur den får fram Fördelningsfunktionen och vice
versa. Gick därefter igenom exponentialfördelningen.Fortsatte med
att visa att tiden mellan två händelser är exponentialfördelad om
antalet händelser är Poissonfördelat. Visade även att
exponentialfördelningen saknar minne.Berättade att eftersom hela
kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Gick
sedan igenom den likformiga fördelningen och tog som exempel på
denna exempel 3.8 och exempel 3.9 i läroboken. Tog sedan exempel
3.14 i läroboken som exempel på en blandad fördelning av diskreta
och kontinuerliga stokastiska variabler. Avslutade sedan med att
gå igenom funktioner av stokastiska variabler. Tog som exempel i
det diskreta fallet exempel 3.16 i Blom, och som kontinuerligt
exempel exempel 3.19 i Blom.
Fre 4 nov Började med att visa oberoende utgående från
betingningsformeln. Avslutade sedan kapitel 2 med att göra exempel
2.23 som exempel på oberoende. Inledde sedan kapitel 3 med att gå
igenom begreppet stokastisk variabel och definera
sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Definierade sedan
Fördelningsfunktionen och berättade om dess egenskaper. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick
sedan igenom ett antal viktiga diskreta fördelningar. Började med
tvåpunktsfördelningen och då speciellt Bernouillifördelningen.
Fortsatte med den likformiga diskreta fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom binomialfördelningen och
hypergeometriska fördelningen.
Ons 2 nov Började med att gå igenom den klassiska
sannolikhetsdefinitionen och multiplikationsprincipen. Gick sedan
igenom de tre fallen: dragning med återläggning med hänsyn till
ordning, dragning utan återläggning med hänsyn till ordning, och
dragning utan återläggning utan hänsyn till ordning. Gick därefter
igenom sannolikheten att vid n dragningar utan återläggning utan
hänsyn till ordning dra k vita kulor från v vita och s svarta
kulor. Utvidgade sedan detta till sannolikheten att dra v vita
och; s svarta och g gula o.s.v när man har r färger. Började sedan
med betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.
Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som
exempel på denna. Avslutade sedan med att visa ex 2.20 som en
intressant tillämpning av Bayes sats.
Mån 31 okt Presenterade först kursens hemsida som hittas
som startsida på canvas och på
http://www.math.kth.se/matstat/gru och visa olika länkar och dess
innehåll.Fortsatte med att ge exempel på olika användningsområden
som ämnet matematisk statistik har och denna kurs ger en
introduktion till. Började sedan med att gå igenom
utfall,utfallsrum,händelser. Förklarade därefter skillnaden mellan
diskreta och kontinuerliga utfallsrum. Tog övningsuppgift 2.1a och
b som exempel på diskreta utfallsrum. Gick sedan igenom snitt,
union, komplement och visade hur man med hjälp av Venndiagram
räknar ut sannolikheter. Definierade i samband med detta
disjunkthet.
|