Aktuell information för kursen
SF1910/SF1925 Tillämpad statistik, 7.5hp, för CSAMH,CLGYMTEMI
period 2, ht 2020.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Tentan 8 jan kommer att vara digital
När anmälningstiden till tentan gått ut kommer ett särskilt
canvasrum för de som anmält sig till tentan att bildas. Där kommer
all information ( som är ganska mycket information) om tentan att
finnas, men här lite kortfattad information:
Tentamen kommer att bestå av en Del I som är en quiz i Canvas med 12
flervalsfrågor (endast svar krävs) och en Del II med uppgifter som
kräver att man laddar upp lösningar. Del II kommer att bestå av fyra
uppgifter som vardera ger 10 poäng. Sista uppgiften kommer att
motsvara uppgift 16 på ordinarie tentamen.
Samma betygsgränser och samma regler för bonuspoäng kommer att gälla
som för salstentan.
Skrivtid: Del 1: 08.00-10.15. Quiz i canvas. Paus: 10.15-10.30 Del
2: 10.30-13.00. Uppgifter vars lösningar scannas och laddas upp som
pdf.
Skrivtid för funka: Del 1: 08.00-11.25.Quiz i canvas. Paus:
11.25-11.45 Del 2: 11.45-15.30. Uppgifter vars lösningar scannas och
laddas upp som pdf.
Tillåtna hjälpmedel: Kursboken (även e-version tillåten), formel och
tabellsamling (även e-version tillåten), samt miniräknare.
Tentamen kommer att övervakas via Zoom.
Detaljerna kring Zoom, uppladdnig m.m. kommer i det särskilda
canvasrummmet som nämnts ovan.
Föreläsningar och övningar
Föreläsningarna finns inspelade och ligger på media gallery på
canvassidan. Det rekommenderas att ni tittar på dem på den
schemalagda föreläsningstiden. På aktuelltsidan finns en dagbok där
huvuddragen av respektive föreläsning sammanfattats. Där finns även
för varje föreläsning en länk till mina föreläsningsanteckningar.
Dessa är just mina föreläsningsanteckningar. Dessa är av blandad
kvalité, oftast mer utförliga och snyggare ju svårare föreläsningen
är. Även övningarna finns inspelade och länkar till dem finns under
respektive övning på sidan Övningar,
förutom övning 15 som ligger på media gallery på canvassidan. Även
här rekommenderas att ni tittar på dem på den schemalagda
övningstiden. Vi kommer även att ha chattar för frågor på
länken
https://join.slack.com/t/sf1923kth/shared_invite/zt-hwdrq1ea-74gGl1wzH7zSjxGf3c_y9Q
Kontrollskrivning
En frivillig kontrollskrivning (KS) kommer att äga rum 18 november
på distans. Kontrollskrivningen består av uppgifter baserade på
kapitel 2-5 i kurslitteraturen. De studenter som får godkänt på
kontrollskrivningen får tillgodoräkna sig uppgift 1-3 på del I på
den ordinarie tentamen och på första omtentamenstillfället.Ingen
anmälan till KS behövs. Kontrollskrivningen kommer att gå ons 18
november kl 8.15-9.45(8.15-10.30 för funka) på nätet. Den kommer att
ligga på Canvas under "Uppgifter" utformad som ett Quizz. Den kommer
publiceras ons 18 november kl 8.10.Kontrollskrivningen kommer att
bestå av 5 uppgifter. Uppgifterna är med flervalssvar. För att få
godkänt krävs minst 3 rätt. Tillåtna hjälpmedel är läroboken(Blom),
institutionens formel- och tabellsamling, samt miniräknare.
Datorlaborationer
Kursen innehåller två frivilliga datorlaborationer. Studenter som
godkänts på den andra av dessa laborationer får tillgodoräkna sig
uppgift 12 på del I och får dessutom 3 bonuspoäng på del II av den
ordinarie tentamen och det första omtentamenstillfället. Laboration
1 kommer att ske på distans med assistenter till hands på chatt.
En skriftlig rapport krävs för Laboration 2 (av maximum 2
studenter, om ni vill arbeta i en grupp). Rapporten ska vara
godkänd för att få bonus för Lab 2. Betyg för Lab 2 är: godkänd/ej
godkänd.
Sista inlämningsdatum för Lab 2 är lördagen den 11 december kl
23:00. Den 10 december kl 13-17 ska det finnas en möjlighet att
ställa frågor om Lab 2, en länk med zoom-möte kommer i början av
vecka 50.Inlämningen kommer att öppnas i canvas den 7 december.
Rapportlayout: förtsättsblad, innehållsförteckning, introduktion,
resultat, sammanfattning och/eller slutsatser, referenser, bilagor
(bilagor ska innehålla den matlab-kod som ni använde för att
åstadkomma resultatet som presenteras i rapporten). OBS! Det ska
vara 1 (en) PDF-fil som ska lämnas in. Ingen inlämning av Lab 1
.För mer info om labbarna se också Examinationsregler
BETA ej längre tillåtet hjälpmedel på tentan
På gamla tentor stod att BETA är tillåtet hjälpmedel på
tentan. Observera att BETA ej längre är tillåtet
hjälpmedel på tentan.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Tentamen
Fr. o.m. per 1 HT18 består tentamen av två delar. Del I
för godkänt och del II för högre betyg. Se Examinationsregler
Det är meningen att det ska vara en vanlig salstentamen.
Mån 7 dec Började med att berätta när test av given
fördelning används och tog som inledande exempel på detta uppgift
15 på junitentan 2019. Gav sedan en kortfattad bakgrund till att
det som benämns Q i §14.3 i Formelsamlingen kan anses vara
approximativt Chi-2fördelad Resten av första timmen och en
tredjedel av andra timmen ägnades sedan helt åt att grundligt gå
igenom exempel 13.18 i läroboken som exempel på test av given
fördelning där man dels måste skatta minst en parameter ur data (i
detta fall my) för att skatta p1,p2,.. pr,
dels slå ihop grupper för att villkoret npistörre än
elller lika med 5 skall gälla för alla i. Berättade sedan om när
homogenitetstest används och tog som exempel på detta uppgift 5 på
augustitentan 2018. Berättade efter detta att man vid
oberoendetest kan använda sig av identiskt samma numerik som man
gör vid homogenitetstest. Visade uppgift 5 på januaritentan 2017
som exempel på detta.Föreläsning15
Tis 1 dec Började med exempel 13.8 och gjorde
nu hypotesprövning i fallet ensidigt test, dels med
kofidensintervallmetoden dels med testvariabelmetoden. Detta
gjordes med olika värden på risknivån och m.h.a. detta visades
också i vilket intervall p-värdet måste ligga. Gjorde sedan
övningsuppgift 13.21a för att visa hur man tar fram styrkan hos
ett test när man har använt sig av konfidensintervallmetoden.
Utifrån detta visades även hur man tar fram styrkefunktionen - i
detta fall h(delta) där delta =myx-myy. Gick
sedan igenom linjär regression och visade att parametrarna alfa
och beta skattas med Minsta-kvadrat-metoden. Fortsatte med att
visa hur man i multipel regression m.h.a. nollhypotesen H0
:betai =0 kan avgöra om man ska kasta respektive
oberoende variabel xi eller ej. Gjorde övningsuppgift
14.7a som exempel på detta. Avslutade med att skissa några exempel
där man med hjälp av residualanalys kan avgöra huruvida det är
troligt att y beror linjärt av x.Föreläsning14
Mån 30 nov Inledde med att skriva upp en lista på
viktiga definitioner och begrepp som används inom hypotesprövning,
såsom nollhypotes,mothypotes, risknivå, p-värde,styrkefunktion och
styrka.Gick därefter igenom exempel 13.1 i läroboken som exempel
på ett fall där man inte använder konfidensintervall för att testa
sin nollhypotes.Fortsatte därefter med exempel 13.4 i läroboken,
där man tar fram styrkan hos testet i exempel 13.1 för
alternativet p=0.9, och tog även fram styrkefunktionen h(p) i
detta fall.Började sedan med exempel 13.8 och gjorde
hypotesprövning i fallet tvåsidigt test, dels med
konfidensintervallmetoden dels med testvariabelmetoden. Detta
gjordes med olika värden på risknivån ? och m.h.a. detta visades
också i vilket intervall p-värdet måste ligga.Föreläsning13
Fre 27 nov Visade att om stickproven är så stora så att
C.G.S. kan användas, så kan man bilda konfidensintervall med
approximativ konfidensgrad för väntevärden och skillnader mellan
väntevärden även om observationerna inte kommer från en
Normalfördelning. Visade sedan konfidensintervall med approximativ
konfidensgrad för p när X tillhör Bin(n,p),; för py- px när Y
tillhör Bin(ny,py) och X tillhör Bin(nx,px) samt för my i
Poisson-fördelningen och att det i alla dessa fall förutsätter att
Normalapproximation är möjlig enligt §5.
Fortsatte med att härleda konfidensintervallet för
standardavvikelsen och för variansen utgående från att summan av
kvadrerade N(0,1)-variabler tillhör CHI2-fördelningen. Avslutade
med att berätta lite om felfortplantning och härledde
felfortplantningsformlerna i § 9.4a m.h.a. Taylorutveckling.
Räknade övningsuppgift 11.13b som exempel på detta.Föreläsning12
Tis 24 nov Började med att repetera härledningen av det
tvåsidiga konfidensintervallet för väntevärdet när mätdata kommer
från en Normalfördelning där standardavvikelsen är känd. Visade
sedan utgående från det första konfidensintervallet hur det
tvåsidiga konfidensintervallet för väntevärdet ser ut när mätdata
kommer från en Normalfördelning där standardavvikelsen är okänd.
Därefter visades konfidensintervallet för skillnaden mellan
väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är kända. Sedan visades hur man bildar ett
konfidensintervall med approximativ konfidensgrad för skillnaden
mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och olika. Därefter visades
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
lika och hur man m.h.a.§11.2 viktar ihop de två
stickprovsvarianserna för att få en skattning s av
standardavvikelsen. Efter detta visades det viktiga fallet när man
har parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa
skillnader.Avslutade med två gamla tentatal-junitentan 2019 och
augustitentan 2019- som exempel på skillnad mellan två stickprovs
väntevärden repektive stickprov i par.Föreläsning11
Tor 19 nov Började med att repetera begreppen TÄTA,TÄTA*
,TÄTA*obs. Fortsatte med att gå igenom Minsta-kvadrat-metoden. Som
exempel visades hur man kunde göra MK-skattningen av arean hos en
kvadrat där två mätdata var sidans längd, och ett mätdata var
diagonalens längd Tog sedan exempel 11.19 i läroboken som exempel
på hur Minsta-kvadrat-skattning går till när två saker ska
skattas. Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa. Definierade
efter detta begreppet medelfel och tog ett par enkla exempel på
detta. Definierade sedan begreppen konfidensintervall och
konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd, och visade då
även hur man får fram samma konfidensintervall genom att använda §
12.1 i Formelsamlingen. Visade avslutningsvis hur man enkelt får
fram de ensidiga konfidensintervallen när man har fått fram det
tvåsidiga. Föreläsning10
Ons 18 nov Började med kapitel 10 och definierade
medelvärde, stickprovsvarians, populationsvarians,
variationskoefficient, median, kovarians och
korrelationskoefficient, begreppen grupperade data, absolut och
relativ frekvens, klassindelade data, histogram och boxplott.
Avslutade kapitel 10 med att visa hur man tar fram kvartiler och
percentiler. Började sedan kap 11 med att redogöra för
skillnaden mellan det riktiga värdet TÄTA, stickprovsvariabeln
TÄTA* och punktskattningen TÄTA*obs. Tog som exempel på
skattning hur man brukar skatta väntevärdet my och
standardavvikelsen sigma vid okänd fördelning. Tog sedan som
ytterligare exempel på skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i Normalfördelningen.
Definierade därefter begreppet konsistent skattning. Presenterade
avslutningsvis Maximum-Likelihood-metoden och räknade exempel
11.10 i läroboken som exempel på denna. Föreläsning9
Fre13 nov Började med Hypergeometriska fördelningen och
skrev upp dess sannolikhetsfunktion. Definierade sedan
Binomialfördelningen och skrev upp dess sannolikhetsfunktion.
Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N<0.1. Visade
sedan utgående från Bernoullifördelningen att villkoret np(1-p)>10
för Normalapproximation egentligen är ett C.G.S.-villkor. Gick
sedan igenom begreppet halvkorrektion. Gjorde sedan uppgift 2 på
tentan som gick 14 aug 2017 som exempel på Centrala
Gränsvärdessatsen. Passade på att i samband med denna uppgift gå
igenom halvkorrektion. Definierade efter detta
Poissonfördelningen. Genom att kombinera satsen om att summan av
oberoende Poissonfördelade stokastiska variabler är
Poissonfördelad med att dela upp intervallet där X är
Poissonfördelad i många delintervall visades sedan att
villkoret µ>15 för normalapproximation
egentligen är ett C.G.S.-villkor. Avslutade kap 7 med att härleda
hur sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet,
vilket motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np). Föreläsning8
Ons 11 nov Började med att skriva upp att uppmätt värde =
korrekt värde+ systematiskt fel+ slumpmässigt fel, och att dålig
noggrannhet är det samma som stort systematiskt fel medan dålig
precision är det samma som stort slumpmässigt fel. Gick sedan
igenom beviset för Markovs olikhet. Använde sedan Markovs olikhet
för att bevisa Stora talens lag och Tjebysjevs olikhet. Skrev
sedan upp täthetsfunktionen och fördelningsfunktionen för
normalfördelningen. Skrev efter det upp täthetsfunktionen och
fördelningsfunktionen för standardiserade normalfördelningen
N(0,1). Skrev sedan upp att om X är N(E[X],D[X]) så gäller att
Y=(X-E[X])/D[X] är N(0,1). Skrev även upp att varje
linjärkombination av oberoende N-fördelade stokastiska variabler
är normalfördelad. Berättade sedan om när och hur man använder
Tabell 1 och Tabell 2 i formelsamlingen och vad alfa-kvantilen är.
Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för k=1,2,3 när X är
N(E[X],D[X]) som exempel på hur Tabell 1 används, och skrev sedan
även upp sannolikheterna för att ett utfall hamnar minst två
respektive tre standardavvikelser ifrån väntevärdet. Avslutade med
att ta fram k när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som
exempel på hur Tabell 2 används och pekade på tabell 2 för att
visa vad k ungefär blir när sannolikheterna är 0.99 och
0.999.Räknade exempel 6.2a,b. Gick sen igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort och att detta även medför att
medelvärdet är approximativt normalfördelat. Avslutade med att
göra exempel 6.6 som exempel på C.G.S. Föreläsning7
Tor 5 nov Började med att repetera definitionerna för
väntevärde och varians i det diskreta och det kontinuerliga fallet
i en dimension. Gick sedan över till två dimensioner och
definierade E[g(X,Y)] i det diskreta och det kontinuerliga fallet.
Definierade sedan begreppet kovarians och visade att V(X)=C(X,X).
Definerade sedan begreppet korrelationskoefficient och berättade
om dess egenskaper. Visade att om X och Y är oberoende så leder
det till att E(XY)=E(X)E(Y) vilket i sin tur leder till att
C(X,Y)=0, d.v.s. att X och Y är okorrelerade. Visade sedan att
omvändningen inte behöver vara sann genom att göra exempel 5.13 i
läroboken. Som övning på att räkna ut en kovarians gjorde jag
sedan övningsuppgift 5.18. Gick sedan igenom räkneregler för
kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Gick därefter igenom
följande viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är
oberoende V(X+Y)=V(X)+V(Y). Fortsatte med att ta fram väntevärde
och standardavvikelse för medelväret av n st ober stokastiska
variabler. Avslutade med att skriva upp Stora talens lag.Föreläsning6
Tis 3 nov Började med att gå igenom flerdimensionella
diskreta och kontinuerliga stokastiska variabler. Gick igenom
begreppen simultan sannolikhetsfunktion repektive simultan
täthetsfunktion och hur man ur dessa får fram den marginella
sannolikhetsfunktionen respektive den marginella täthetsfunktionen
och hur man vid oberoende även kan gå åt andra hållet. Visade
sedan hur man räknar ut sannolikheter i det två-dimensionella
diskreta och kontinuerliga fallet. Fortsatte med att visa hur man
tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående
från Fördelningsfunktionerna för X respektive Y. Avslutade kapitel
4 med att som exempel på summa visa att summan av ober
Poisonfördelade stok.var. är Poissonfördelad.Började med kapitel 5
och startade med att berätta att väntevärdet är vad man får i
genomsnitt om man gör oändligt många försök. T.ex. blir ju det
genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan
exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog
sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter
variansen V(X) och standardavvikelsen D(X). Definierade även
variationskoefficienten R(X)=D(X)/E(X), och medianen xtilde som
definieras av att P(X<xtilde)=0.5. Sedan använde jag mig även
här av ex 5.1 i boken för att räkna ut variansen m.h.a.
definitionen. Härledde sedan ur definitionen formeln
V(X)=E(X²)-(E(X))² och räknade ut samma varians m.h.a. denna
formel. Gick avslutningsvis igenom följande viktiga räkneregler
för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c,
V(aX+b)=V(aX)=a²V(X), samt om X och Y är oberoende:
V(X+Y)=V(X)+V(Y). Föreläsning5
Mån 2 nov Började med kontinuerliga stokastiska variabler.
Definierade täthetsfunktionen och gick igenom hur man ur den får
fram Fördelningsfunktionen och vice versa. Gick sedan igenom den
likformiga fördelningen och tog som exempel på denna exempel 3.8
och exempel 3.9 i läroboken. Gick därefter igenom
exponentialfördelningen.Fortsatte med att visa att tiden mellan
två händelser är exponentialfördelad om antalet händelser är
Poissonfördelat. Visade även att exponentialfördelningen saknar
minne.Berättade att eftersom hela kapitel 6 ägnas åt
Normalfördelningen gås den igenom då. Tog sedan exempel 3.14 i
läroboken som exempel på en blandad fördelning av diskreta och
kontinuerliga stokastiska variabler. Fortsatte sedan med att gå
igenom funktioner av stokastiska variabler. Tog som exempel i det
diskreta fallet exempel 3.16 i Blom och som kontinuerligt exempel
gjorde jag exempel 3.19 i Blom.Föreläsning4
Tor 29 okt Inledde kapitel 3 med att gå igenom begreppet
stokastisk variabel och definera sannolikhetsfunktionen. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp
stolpdiagrammet. Definierade sedan Fördelningsfunktionen och
berättade om dess egenskaper. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp den. Gick sedan igenom ett antal
viktiga diskreta fördelningar. Började med tvåpunktsfördelningen
och då speciellt Bernouillifördelningen. Fortsatte med den
likformiga fördelningen och för-första-gången-fördelningen och den
snarlika geometriska fördelningen. Avslutade med att gå igenom
binomialfördelningen, hypergeometriska fördelningen och
Poissonfördelningen.Föreläsning3
Ons 28 okt Började med att repetera de tre fallen:
Dragning med återläggning med hänsyn till ordning, dragning utan
återläggning med hänsyn till ordning, och dragning utan
återläggning utan hänsyn till ordning. Gick därefter igenom
sannolikheten att vid n dragningar utan återläggning utan hänsyn
till ordning dra k vita kulor från v vita och s svarta kulor.
Utvidgade sedan detta till sannolikheten att dra v vita och; s
svarta och g gula o.s.v när man har r färger. Började sedan med
betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.
Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som
exempel på denna. Fortsatte sedan med att räkna igenom ex 2.20 som
en intressant tillämpning av Bayes sats Visade sedan definitionen
för oberoende utgående från betingningsformeln. Avslutade med
exempel 2.23 som exempel på oberoende.Föreläsning2
Mån 26 okt Började med att ge exempel på olika
användningsområden som ämnet matematisk statistik har och denna
kurs ger en introduktion till.Presenterade sedan kursens hemsida
som hittas som startsida på canvas och på
http://www.math.kth.se/matstat/gru och visa olika länkar och dess
innehåll. Började sedan med att gå igenom
utfall,utfallsrum,händelser. Gick sedan igenom snitt, union,
komplement och visade hur man med hjälp av Venndiagram räknar ut
sannolikheter. Definierade i samband med detta disjunkthet.
Förklarade därefter skillnaden mellan diskreta och kontinuerliga
utfallsrum. Tog övningsuppgift 2.1a och b som exempel på diskreta
utfallsrum.Resten av tiden ägnades åt kombinatorik. Började med
multiplikationsprincipen och den klassiska
sannolikhetsdefinitinen. Gick igenom draging med återläggning med
hänsyn till ordning och tog som exempel att antal pinkoder blir
10^4 eftersom antal kombinationer när man drar k ggr från n
element blir n^k.Som exempel på dragning utan återläggning med
hänsyn till ordning tog jag en förening med 8 medlemmar som skulle
välja ordförande,sekreterare och kassör vilket ger 8ggr 7ggr 6
kombinationer. Allmänna fallet n!/(n-k)! kombinationer. Gick sedan
igenom fallet dragning utan återläggning utan hänsyn till
ordning.Tog som exempel hur många pokergivar det finns.
52!/(5!ggr47!). D.v.s. 52 över 5 gånger. I allmänna fallet har vi
då n över k kombinationer. Föreläsning1
|