Aktuell information för kursen
SF1910/SF1925 Tillämpad statistik, 7.5hp, för CSAMH,CLGYM period
2, ht 2023.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Tider och salar för Räknestugorna
Ons 29 nov kl 13-15, sal E1
Ons 6 dec kl 10-12, sal F2
Tor 14 dec kl 10-12, sal Q1
Laboration 2 fredag 15/12 kl 8-12
Lab 2 är frivillig. Den som har godkänt resultat på Lab 2
får tillgodoräkna sig uppg 12 på del I och får dessutom 3
bonuspoäng på del II. Detta gäller på ordinarie
tentamen och första omtentamen.
De som önskar redovisa Laboration 2 måste boka en
redovisningstid senast onsdag 13/12 kl 23.59 (se
instruktionen nedan).
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och
öppna Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av
labspecifikationen som ni har skrivit era personnummer på
förstasidan på. Denna utskrift undertecknar labassistenten
efter att han eller hon har godkänt labben och utskriften
fungerar sedan som ert kvitto på resultatet.
Instruktion om hur man anmäler sig till lab2
Gå in på personer. Välj en grupp 1- 80.(Det
finns 5 grupper per kvart, max 2 studenter per grupp.)
Gå in i kalender. Klicka på "Hitta möte". Välj kurs.
Klicka på "Lämna in". Välj tid. Klicka på "Reservera".
Kontrollskrivning
Kontrollskrivningen Onsdagen 22/11 kl 8-10 omfattar kap 2-5 i
kurslitteraturen.De studenter som får godkänt på
kontrollskrivningen får tillgodoräkna sig uppgift 1-3 på del I på
den ordinarie tentamen och på första omtentamenstillfället.
Kontrollskrivningen kommer att bestå av 5 uppgifter. För att få
godkänt krävs minst 3 rätt.Tillåtet hjälpmedel är miniräknare.
Datorlaborationer
Utöver föreläsningar och övningar innehåller kursen två
frivilliga datorlaborationer. Studenter som godkänts på den
andra av dessa laborationer får tillgodoräkna sig uppgift 12 på
del I och får dessutom 3 bonuspoäng på del II av den ordinarie
tentamen och det första omtentamenstillfället.
Laboration 1 är både en introduktion till hur
man använder MATLAB i sannolikhetsteori och statistik och en
förberedelse till den andra datorlaborationen. Det finns
möjlighet att få handledning på denna laboration under ett
schemalagt laborationspass.
Laboration 2 som är den bonusgrundande
datorlaborationen utförs i grupper om 2 studenter, men de
skriftliga förberedelseuppgifterna ska lösas individuellt.
Varje grupp kommer att få boka ett femton minuter långt
redovisningstillfälle i datorsal. Både de skriftliga
individuella förberedelseuppgifterna och
laborationsuppgifterna måste vara färdigställda före
redovisningstillfället. Det kommer inte att ges möjlighet till
handledning i datorsal, men det finns möjlighet att i
begränsad omfattning fråga övningsledarna om hjälp i samband
med övningsundervisningen.
Redovisningstillfällen för datorlaboration 2 kommer att bokas i
kalendern i Canvas och detaljerad information om hur detta görs
skickas ut under kursens gång.
Syftet med datorlaborationerna är att ge en fördjupad
förståelse för de begrepp och den teori som tas upp i kursen och
samtliga studenter rekommenderas därför att delta på
datorlaborationerna.
Föreläsningar
Föreläsningarna kommer att ges på sal. Efter varje föreläsning
kommer jag att längst ner på denna sida under rubriken Föreläsningsdagbok
skriva en kort sammanfattning av vad som gåtts igenom på
varje föreläsning. Där finns även föreläsningsanteckningar som är
just anteckningar av varierande utförlighet och kvalitet.
Inspelade föreläsningar
Det finns också inspelade föreläsningar.De ligger på media gallery
på canvassidan. På sidan Videoföreläsningsdagbok
finns en dagbok där huvuddragen av respektive föreläsning
sammanfattats. Där står också hur lång respektive föreläsning är.
Kolla det innan ni börjar titta. Eftersom de är inspelade så är de
ibland utvidgade versioner av föreläsningarna jag håller på sal.
Detta beror på att jag inte har behövt bestämma mig för om jag ska
lägga dem på en nivå för de som bara vill ha godkänt eller på en
nivå för de som vill ha lite mer fördjupning utan jag gör både
och. Ljudet blir bättre om man använder hörlurar till sin laptop.
Övningar
Övningarna kommer att ges på sal. Även övningarna finns inspelade,
(men är inte identiska med de som ges i direkttid på sal även om
det oftast är samma uppgifter som gås igenom) och länkar till dem
finns under respektive övning på länken Övningsplan
, förutom övning 15 som ligger på media gallery på canvassidan.
Föreläsningsdagbok
Ons 6 dec Började med att fortsätta med
hypotesprövning m.h.a. konfidensintervallmetoden. Genom att
använda exempel 13.8 gjorde jag nu hypotesprövning först i
fallet tvåsidigt test, dels med kofidensintervallmetoden dels
med testvariabelmetoden. Detta gjordes med olika värden på
risknivån alfa och m.h.a. detta visades också i vilket
intervall p-värdet måste ligga. Genom att använda exempel 13.8
gjorde jag sedan också hypotesprövning i fallet ensidigt test,
dels med kofidensintervallmetoden dels med
testvariabelmetoden. Detta gjordes med olika värden på
risknivån alfa och m.h.a. detta visades också i vilket
intervall p-värdet måste ligga. Gjorde sedan övningsuppgift
13.21a för att visa hur man tar fram styrkan hos ett test när
man har använt sig av konfidensintervallmetoden. Utifrån detta
visades även hur man tar fram styrkefunktionen - i detta fall
h(delta) där delta =myx-myy. Gick sedan
igenom linjär regression och visade att parametrarna alfa och
beta skattas med Minsta-kvadrat-metoden. Fortsatte med att
visa hur man m.h.a. nollhypotesen
H0 :beta =0 kan avgöra om man ska kasta x eller ej.
Avslutade med att gå igenom exempel 14.7a i läroboken som
exempel på hur man med hjälp av multipel regression går
tillväga för att avgöra vilka storheter xi man ska
kasta eller inte när man antagit att y beror av xi:na.
Tis 5 dec Inledde med att avsluta kap 12 genom
att först härleda konfidensintervallet för standardavvikelsen och
för variansen utgående från att summan av kvadrerade
N(0,1)-variabler tillhör CHI2-fördelningen. Visade sedan hur man
tar fram dessa konfidensintervall m.h.a. §12.4. Inledde sedan kap
13 med att skriva upp en lista på viktiga definitioner och begrepp
som används inom hypotesprövning, såsom nollhypotes,mothypotes,
risknivå, p-värde,styrka hos test. styrkefunktion,testvariabel,
och kritiskt område. Gick därefter igenom exempel 13.1 i läroboken
som exempel på ett fall där man inte använder konfidensintervall
för att testa sin nollhypotes och använde exempel 13.1 för att
konkretisera begreppen
nollhypotes,mothypotes,risknivå,p-värde,testvariabel,och kritiskt
område. Fortsatte därefter med exempel 13.4 i läroboken, där man
tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9,
och tog även fram styrkefunktionen h(p) i detta fall. Började
sedan med exempel 13.8 och gjorde hypotesprövning i fallet
tvåsidigt test med konfidensintervallmetoden. Detta gjordes med
olika värden på risknivån alfa och m.h.a. detta visades också i
vilket intervall p-värdet måste ligga.
Fre 1 dec Först visades konfidensintervallet för
skillnaden mellan väntevärdena hos två Normalfördelade stickprov
där standardavvikelserna är kända. Sedan visades hur man bildar
ett konfidensintervall med approximativ konfidensgrad för
skillnaden mellan väntevärdena hos två Normalfördelade stickprov
där standardavvikelserna är okända och olika. Efter det visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
lika och hur man m.h.a.§11.2 viktar ihop de två
stickprovsvarianserna för att få en skattning s av
standardavvikelsen. Sedan visades det viktiga fallet när man har
parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa skillnader.
Fortsatte sedan med två gamla tentatal-junitentan 2019 och
augustitentan 2019- som exempel på skillnad mellan två stickprovs
väntevärden repektive stickprov i par. Resten av föreläsningen
ägnades åt konfidensintervall som man tar fram med hjälp av §12.3
i Formelsamlingen: Visade först att om stickproven är så stora så
att C.G.S. kan användas, så kan man bilda konfidensintervall med
approximativ konfidensgrad för väntevärden och skillnader mellan
väntevärden även om observationerna inte kommer från en
Normalfördelning. Visade sedan konfidensintervall med approximativ
konfidensgrad för p när X tillhör Bin(n,p), för py- px när Y
tillhör Bin(ny,py) och X tillhör Bin(nx,px), samt för my i
Poisson-fördelningen, och att det i alla dessa fall förutsätter
att Normalapproximation är möjlig enligt §5 respektive §6. Visade
hur vart och ett av dessa approximativa konfidensintervall ovan
tas fram m.h.a. §12.3 i formelsamlingen.
Ons 29 nov Avslutade först kap 11 genom att definiera
begreppet medelfel och tog ett par enkla exempel på detta. Inledde
sedan kap 12 med att definiera begreppen konfidensintervall och
konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd. Visade då också
hur man enkelt får fram de ensidiga konfidensintervallen när man
har fått fram det tvåsidiga. Visade sedan hur man får fram samma
konfidensintervall genom att använda § 12.1 i Formelsamlingen.
Visade då också hur man tar fram konfidensintervallet för µ om
µ^*obs t.ex. är (x1+2x2)/3. Visade sedan utgående från det första
konfidensintervallet hur det tvåsidiga konfidensintervallet för
väntevärdet ser ut när mätdata kommer från en Normalfördelning där
standardavvikelsen är okänd. Därefter visades konfidensintervallet
för skillnaden mellan väntevärdena hos två Normalfördelade
stickprov där standardavvikelserna är kända.
Mån 27 nov Började kap 11 med att redogöra för skillnaden
mellan det riktiga värdet TÄTA, stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning
hur man brukar skatta väntevärdet my och standardavvikelsen sigma
vid okänd fördelning. Tog sedan som ytterligare exempel på
skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i
Normalfördelningen.Presenterade därefter
Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken
som exempel på denna. Gick sedan igenom Minsta-kvadrat-metoden.
Som exempel visades hur man kunde göra MK-skattningen av arean hos
en kvadrat där två mätdata var sidans längd, och ett mätdata var
diagonalens längd. Tog sedan exempel 11.19 i läroboken som exempel
på hur Minsta-kvadrat-skattning går till när två saker ska
skattas. Skrev efter detta upp definitionen för konsistent
skattning. Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa.
Tor 23 nov Definierade först Poissonfördelningen. Genom
att kombinera satsen om att summan av oberoende Poissonfördelade
stokastiska variabler är Poissonfördelad med att dela upp
intervallet där X är Poissonfördelad i många delintervall visades
att villkoret µ>15 för
normalapproximation egentligen är ett C.G.S.-villkor.
Avslutade sedan kap 7 med att härleda hur sannolikhetsdefinitionen
för Binomialfördelningen övergår i sannolikhetsfunktionen för
Poissonfördelningen om p är litet, vilket motiverar att om p<0.1
så gäller att Bin(n,p)~Po(np). Började sedan med kapitel 10 och
definierade medelvärde, stickprovsvarians, populationsvarians,
variationskoefficient, median, kovarians och
korrelationskoefficient, begreppen grupperade data, absolut och
relativ frekvens, klassindelade data, histogram och boxplott.
Avslutade kapitel 10 med att visa hur man tar fram kvartiler och
percentiler.
Mån 20 nov Inledde med att repetera det mest
grundläggande rörande Normalfördelningen. Fortsatte sedan med att
ta fram k när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på
hur Tabell 2 används. Skrev sedan upp att varje linjärkombination
av oberoende Normalfördelade stokastiska varaibler är
Normalfördelad. Räknade exempel 6.2a,b som exempel på detta.
Fortsatte med att med att gå igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort och att detta även medför att
medelvärdet är approximativt normalfördelat. Gjorde sedan exempel
6.6 som exempel på C.G.S. Började sedan med Hypergeometriska
fördelningen och skrev upp dess sannolikhetsfunktion. Definierade
sedan Binomialfördelningen och skrev upp dess
sannolikhetsfunktion. Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N<0.1.
Visade sedan utgående från Bernoullifördelningen att
villkoret np(1-p)>10 för Normalapproximation egentligen
är ett C.G.S.-villkor. Gick til sist igenom begreppet
halvkorrektion.
Fre 17 nov Började med att repetera definitioner och
begrepp från föregående föreläsning. Gick sedan igenom räkneregler
för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Gick därefter igenom
följande viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är
oberoende V(X+Y)=V(X)+V(Y). Fortsatte med att ta fram väntevärde
och standardavvikelse för medelväret av n st ober stokastiska
variabler. Skrev sedan upp Stora talens lag. Gick sedan igenom
beviset för Markovs olikhet. Använde sedan Markovs olikhet för att
bevisa Stora talens lag och Tjebysjevs olikhet. Fortsatte med att
skriva upp att uppmätt värde = korrekt värde+ systematiskt fel+
slumpmässigt fel, och att dålig noggrannhet är det samma som stort
systematiskt fel medan dålig precision är det samma som stort
slumpmässigt fel. Skrev sedan upp täthetsfunktionen och
fördelningsfunktionen för normalfördelningen. Skrev efter det upp
täthetsfunktionen och fördelningsfunktionen för standardiserade
normalfördelningen N(0,1). Skrev sedan upp att om X är
N(E[X],D[X]) så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade
sedan om när och hur man använder Tabell 1 och Tabell 2 i
formelsamlingen och vad alfa-kvantilen är. Tog fram P(E[X]-kD[X]
< X < E[X]+kD[X]) för k=2 när X är N(E[X],D[X]) som exempel
på hur Tabell 1 används.
Mån 13 nov Började med kapitel 5 och startade med att
berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet av
ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken,och räknade
därigenom ut E(X). Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Gjorde
sedan detsamma med E(g(X,Y)). Tog sedan och räknade ut E(X²) i Ex.
5.1 i boken. Definierade därefter variansen V(X) och
standardavvikelsen D(X). Definierade därefter variansen V(X) och
standardavvikelsen D(X). Definierade även variationskoefficienten
R(X)=D(X)/E(X), och medianen xtilde som definieras av att
P(X<xtilde)=0.5. Sedan använde jag mig även här av ex 5.1 i
boken för att räkna ut variansen m.h.a. definitionen. Härledde
sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade ut
samma varians m.h.a. denna formel. Gick sedan igenom följande
viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c, V(aX+b)=V(aX)=a²V(X).
Definierade sedan begreppet kovarians och och begreppet
korrelationskoefficient och berättade om dess egenskaper. Visade
också att V(X)=C(X,X). Gjorde sedan ex 5.13 i Blom för att visa
att X och Y kan vara okorrelerade utan att vara oberoende. Skrev
upp att om X och Y är oberoende så leder det till att
E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0 D.v.s. om
X och Y är oberoende så leder det alltid till att X och Y är
okorrelerade. Som övning på att räkna ut en kovarians gjorde jag
avslutningsvis övningsuppgift 5.18. Visade också här att om X och
Y är okorrelerade behöver det inte leda till att X och Y är
oberoende.
Fre 10 nov Började med att gå igenom funktioner av
stokastiska variabler. Började med att gå igenom det diskreta
fallet. Tog exempel 3.16 i Blom. Gick sedan igenom det
kontinuerliga fallet. Tog exempel 3.20 och 3.19 i Blom. Berättade
lite om slumptalsgenerering i samband med exempel 3.19 Började
sedan kapitel 4 med att gå igenom flerdimensionella diskreta och
kontinuerliga stokastiska variabler. Gick igenom begreppen
simultan sannolikhetsfunktion repektive simultan täthetsfunktion
och hur man ur dessa får fram den marginella
sannolikhetsfunktionen respektive den marginella täthetsfunktionen
och hur man vid oberoende även kan gå åt andra hållet. Visade
också hur man räknar ut sannolikheter i det två-dimensionella
diskreta och kontinuerliga fallet. Fortsatte med att visa hur man
tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående
från Fördelningsfunktionerna för X respektive Y. Avslutade kapitel
4 med att som exempel på summa visa att summan av ober
Poisonfördelade stok.var. är Poissonfördelad. Visade också allra
sist hur faltning går till i det kontinuerliga fallet genom att
som exempel på summa visa hur fördelningsfunktionen för Z = X+Y
ser ut när X och Y är oberoende och man har täthetsfunktionerna
för X och Y.
Tis 7 nov Började med att gå igenom hypergeometriska
fördelningen. Fortsatte med att gå igenom Poissonfördelningen och
skrev upp satsen som säger att summan av oberoende
Poissonfördelningar också är Poissonfördelad. Tog exempel 7.7 i
Blom som exempel på detta. Började sedan med kontinuerliga
stokastiska variabler. Definierade täthetsfunktionen och gick
igenom hur man ur den får fram Fördelningsfunktionen och vice
versa. Gick därefter igenom exponentialfördelningen.Fortsatte med
att visa att tiden mellan två händelser är exponentialfördelad om
antalet händelser är Poissonfördelat. Visade även att
exponentialfördelningen saknar minne.Berättade att eftersom hela
kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Gick
sedan igenom den likformiga fördelningen och tog som exempel på
denna exempel 3.8 och exempel 3.9 i läroboken. Avslutade sedan med
exempel 3.14 i läroboken som exempel på en blandad fördelning av
diskreta och kontinuerliga stokastiska variabler.
Tor 2 nov Inledde med att visa ex 2.20 som en intressant
tillämpning av Bayes sats.Visade sedan oberoende utgående från
betingningsformeln. Avslutade sedan kapitel 2 med att göra exempel
2.23 som exempel på oberoende. Inledde sedan kapitel 3 med att gå
igenom begreppet stokastisk variabel och definera
sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Definierade sedan
Fördelningsfunktionen och berättade om dess egenskaper. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick
sedan igenom ett antal viktiga diskreta fördelningar. Började med
tvåpunktsfördelningen och då speciellt Bernouillifördelningen.
Fortsatte med den likformiga diskreta fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom binomialfördelningen.
Ons 1 nov Började med att gå igenom de tre fallen:
dragning med återläggning med hänsyn till ordning, dragning utan
återläggning med hänsyn till ordning, och dragning utan
återläggning utan hänsyn till ordning. Gick därefter igenom
sannolikheten att vid n dragningar utan återläggning utan hänsyn
till ordning dra k blåa kulor från b blåa och g gula kulor.
Utvidgade sedan detta till sannolikheten att dra b blåa och; r
röda och g gula o.s.v när man har 3 färger. Började sedan med
betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.
Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som
exempel på denna.
Mån 30 okt Presenterade först kursens hemsida som hittas
som startsida på canvas och på
http://www.math.kth.se/matstat/gru och visa olika länkar och dess
innehåll.Fortsatte med att ge exempel på olika användningsområden
som ämnet matematisk statistik har och denna kurs ger en
introduktion till. Började sedan med att gå igenom
utfall,utfallsrum,händelser. Förklarade därefter skillnaden mellan
diskreta och kontinuerliga utfallsrum. Tog övningsuppgift 2.1a och
b som exempel på diskreta utfallsrum. Gick sedan igenom snitt,
union, komplement och visade hur man med hjälp av Venndiagram
räknar ut sannolikheter. Definierade i samband med detta
disjunkthet.Definerade då även oberoende.Inledde till sist
kombinatoriken med att gå igenom den klassiska
sannolikhetsdefinitionen och multiplikationsprincipen .
|