KTH Mathematik


Matematisk statistik
SF1914/SF1915/SF1916 Sannolikhetsteori och statistik för CFATE3/CDEPR3/CLGYM3-MAKE/CMAST3/CITEH3.

                                          
Aktuell information.

Följ denna sida kontinuerligt. Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.

Laboration 2 fredag 13/10 kl 8-12

De som önskar redovisa Laboration 2 måste boka en redovisningstid senast onsdag 11/10 kl 23.59 (se instruktionen nedan).

Se till att komma till labsalen minst tio minuter före redovisningstiden så att ni hinner logga in på datorn och öppna Matlab samt ta fram era redovisningsuppgifter.

Ni behöver också ha med er en utskrift av labspecifikationen som ni har skrivit era personnummer på förstasidan på. Denna utskrift undertecknar labassistenten efter att han eller hon har godkänt labben och utskriften fungerar sedan som ert kvitto på resultatet.

                    Instruktion om hur man anmäler sig till lab2

Gå in på personer. Välj en grupp 1- 80.(Det finns 5 grupper per kvart, max 2 studenter per grupp.) Gå in i kalender. Klicka på "Hitta möte". Välj kurs. Klicka på "Lämna in". Välj tid. Klicka på "Reservera".


              

Datorlaborationer

Utöver föreläsningar och övningar innehåller kursen två frivilliga datorlaborationer. Studenter som godkänts på den andra av dessa laborationer får tillgodoräkna sig uppgift 12 på del I och får dessutom 3 bonuspoäng på del II av den ordinarie tentamen och det första omtentamenstillfället.

Laboration 1 är både en introduktion till hur man använder MATLAB i sannolikhetsteori och statistik och en förberedelse till den andra datorlaborationen. Det finns möjlighet att få handledning på denna laboration under ett schemalagt laborationspass.

Laboration 2 som är den bonusgrundande datorlaborationen utförs i grupper om 2 studenter, men de skriftliga förberedelseuppgifterna ska lösas individuellt. Varje grupp kommer att få boka ett femton minuter långt redovisningstillfälle i datorsal. Både de skriftliga individuella förberedelseuppgifterna och laborationsuppgifterna måste vara färdigställda före redovisningstillfället. Det kommer inte att ges möjlighet till handledning i datorsal, men det finns möjlighet att i begränsad omfattning fråga övningsledarna om hjälp i samband med övningsundervisningen.

Redovisningstillfällen för datorlaboration 2 kommer att bokas i kalendern i Canvas och detaljerad information om hur detta görs skickas ut under kursens gång.

Syftet med datorlaborationerna är att ge en fördjupad förståelse för de begrepp och den teori som tas upp i kursen och samtliga studenter rekommenderas därför att delta på datorlaborationerna.



Tentamen kommer att vara en vanlig salstentamen

Fr. o.m. per 1 HT18 består tentamen av två delar. Del I för godkänt och del II för högre betyg. Se Examinationsregler Tentamen kommer att bestå av en Del I med 12 flervalsfrågor (endast svar krävs) och en Del II med uppgifter som kräver lösningar. Del II kommer att bestå av fyra uppgifter som vardera ger 10 poäng. Tillåtna hjälpmedel: Formel och tabellsamling som delas ut vid tentamenstillfället,samt miniräknare.

Föreläsningar

Föreläsningarna kommer att ges på sal. Efter varje föreläsning kommer jag att längst ner på denna sida under rubriken Föreläsningsdagbok skriva en kort sammanfattning av vad som gåtts igenom på varje föreläsning. Där finns även föreläsningsanteckningar som är just anteckningar av varierande utförlighet och kvalitet.

Inspelade föreläsningar

Det finns också inspelade föreläsningar.De ligger på media gallery på canvassidan. På sidan Videoföreläsningsdagbok finns en dagbok där huvuddragen av respektive föreläsning sammanfattats. Där står också hur lång respektive föreläsning är. Kolla det innan ni börjar titta. Eftersom de är inspelade så är de ibland utvidgade versioner av föreläsningarna jag håller på sal. Detta beror på att jag inte har behövt bestämma mig för om jag ska lägga dem på en nivå för de som bara vill ha godkänt eller på en nivå för de som vill ha lite mer fördjupning utan jag gör både och. Ljudet blir bättre om man använder hörlurar till sin laptop.

Övningar

Övningarna kommer att ges på sal. Även övningarna finns inspelade, (men är inte identiska med de som ges i direkttid på sal även om det oftast är samma uppgifter som gås igenom) och länkar till dem finns under respektive övning på länken Övningsplan , förutom övning 15 som ligger på media gallery på canvassidan.

Formel och Tabellsamling på tentamen

På tentan kommer inte längre egen medhavd  Formelsamling och tabellsamling i matematisk statistik längre att tillåtas som hjälpmedel. I stället delas  Formelsamling och tabellsamling i matematisk statistik ut vid själva tentamenstillfället och lämnas sedan in igen av tentanden tillsammans med tentan.

BETA ej längre tillåtet hjälpmedel på tentan

På gamla tentor stod  att BETA är tillåtet hjälpmedel på tentan.  Observera att BETA ej längre är tillåtet hjälpmedel på tentan.

Kontrollskrivningen 20 september kommer att ges på sal

En frivillig kontrollskrivning (KS) kommer att äga rum 20 september . Kontrollskrivningen består av 5 uppgifter baserade på kapitel 2-5 i kurslitteraturen där endast svar krävs. De studenter som får godkänt på kontrollskrivningen får tillgodoräkna sig uppgift 1-3 på del I på den ordinarie tentamen och på första omtentamenstillfället.Anmälan till KS krävs. För att få godkänt krävs minst 3 rätt. Tillåtet hjälpmedel är miniräknare.

Administrativa ärenden

I ärenden som är administrativa kontakta studentoffice@math.kth.se

Föreläsningsdagbok


Tis 10 okt Började kap 13.10 med att berätta när test av given fördelning används. Tog som inledande exempel på test av given fördelning uppgift 15 på januaritentan 2019. Nästan halva föreläsningen ägnades sedan helt åt att grundligt gå igenom exempel 13.18 i läroboken som exempel på test av given fördelning där man dels måste skatta minst en parameter ur data (i detta fall µ) för att skatta p1,p2,.. pr, dels slå ihop grupper för att villkoret npi större än eller lika med 5 skall gälla för alla i. Berättade sedan om när homogenitetstest används och tog som exempel på detta uppgift 5 på augustitentan 2018. Berättade efter detta att man vid oberoendetest kan använda sig av identiskt samma numerik som man gör vid homogenitetstest. Visade uppgift 2 på exempeltentan som exempel på detta.

Mån 9 okt Började med att fortsätta med hypotesprövning m.h.a. konfidensintervallmetoden. Genom att använda exempel 13.8 gjorde jag nu hypotesprövning först i fallet tvåsidigt test, dels med kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika värden på risknivån alfa och m.h.a. detta visades också i vilket intervall p-värdet måste ligga. Genom att använda exempel 13.8 gjorde jag sedan också hypotesprövning i fallet ensidigt test, dels med kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika värden på risknivån alfa och m.h.a. detta visades också i vilket intervall p-värdet måste ligga. Gjorde sedan övningsuppgift 13.21a för att visa hur man tar fram styrkan hos ett test när man har använt sig av konfidensintervallmetoden. Utifrån detta visades även hur man tar fram styrkefunktionen - i detta fall h(delta) där delta =myx-myy. Gick sedan igenom linjär regression och visade att parametrarna alfa och beta skattas med Minsta-kvadrat-metoden. Fortsatte med att visa hur man m.h.a. nollhypotesen
H0 :beta =0 kan avgöra om man ska kasta x eller ej. Avslutade med att gå igenom exempel 14.7a i läroboken som exempel på hur man med hjälp av multipel regression går tillväga för att avgöra vilka storheter xi man ska kasta eller inte när man antagit att y beror av xi:na.


Ons 4 okt Inledde med att avsluta kap 12 genom att först härleda konfidensintervallet för standardavvikelsen och för variansen utgående från att summan av kvadrerade N(0,1)-variabler tillhör CHI2-fördelningen. Visade sedan hur man tar fram dessa konfidensintervall m.h.a. §12.4. Inledde sedan kap 13 med att skriva upp en lista på viktiga definitioner och begrepp som används inom hypotesprövning, såsom nollhypotes,mothypotes, risknivå, p-värde,styrka hos test. styrkefunktion,testvariabel, och kritiskt område. Gick därefter igenom exempel 13.1 i läroboken som exempel på ett fall där man inte använder konfidensintervall för att testa sin nollhypotes och använde exempel 13.1 för att konkretisera begreppen nollhypotes,mothypotes,risknivå,p-värde,testvariabel,och kritiskt område. Fortsatte därefter med exempel 13.4 i läroboken, där man tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9, och tog även fram styrkefunktionen h(p) i detta fall. Började sedan med exempel 13.8 och gjorde hypotesprövning i fallet tvåsidigt test med konfidensintervallmetoden. Detta gjordes med olika värden på risknivån alfa och m.h.a. detta visades också i vilket intervall p-värdet måste ligga.



Mån 2 okt Först visades det viktiga fallet när man har parvisa observationer-"stickprov i par"- och att konfidensintervallet för väntevärdet av de parvisa skillnaderna då tas fram som om man har ett stickprov av parvisa skillnader. Fortsatte sedan med två gamla tentatal-junitentan 2019 och augustitentan 2019- som exempel på skillnad mellan två stickprovs väntevärden repektive stickprov i par. Resten av föreläsningen ägnades åt konfidensintervall som man tar fram med hjälp av §12.3 i Formelsamlingen: Visade först att om stickproven är så stora så att C.G.S. kan användas, så kan man bilda konfidensintervall med approximativ konfidensgrad för väntevärden och skillnader mellan väntevärden även om observationerna inte kommer från en Normalfördelning. Visade sedan konfidensintervall med approximativ konfidensgrad för p när X tillhör Bin(n,p), för py- px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px), samt för my i Poisson-fördelningen, och att det i alla dessa fall förutsätter att Normalapproximation är möjlig enligt §5 respektive §6. Visade hur vart och ett av dessa approximativa konfidensintervall ovan tas fram m.h.a. §12.3 i formelsamlingen.


Ons 27 sep Definierade först begreppen konfidensintervall och konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga konfidensintervallet för väntevärdet när mätdata kommer från en Normalfördelning där standardavvikelsen är känd. Visade då också hur man enkelt får fram de ensidiga konfidensintervallen när man har fått fram det tvåsidiga. Visade sedan hur man får fram samma konfidensintervall genom att använda § 12.1 i Formelsamlingen. Visade då också hur man tar fram konfidensintervallet för µ om µ^*obs t.ex. är (x1+2x2)/3. Visade sedan utgående från det första konfidensintervallet hur det tvåsidiga konfidensintervallet för väntevärdet ser ut när mätdata kommer från en Normalfördelning där standardavvikelsen är okänd. Därefter visades konfidensintervallet för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är kända. Sedan visades hur man bildar ett konfidensintervall med approximativ konfidensgrad för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är okända och olika. Avslutningsvis visades konfidensintervallet för skillnaden mellan väntevärdena hos två Normalfördelade stickprov där standardavvikelserna är okända och lika och hur man m.h.a.§11.2 viktar ihop de två stickprovsvarianserna för att få en skattning s av standardavvikelsen.

Mån 25 sep Började med att repetera begreppen TÄTA,TÄTA* ,TÄTA*obs.Presenterade därefter Maximum-Likelihood-metoden och räknade exempel 11.10 i läroboken som exempel på denna. Gick sedan igenom Minsta-kvadrat-metoden. Som exempel visades hur man kunde göra MK-skattningen av arean hos en kvadrat där två mätdata var sidans längd, och ett mätdata var diagonalens längd. Tog sedan exempel 11.19 i läroboken som exempel på hur Minsta-kvadrat-skattning går till när två saker ska skattas. Definerade därefter begreppen väntevärdesriktighet och effektivitet och tog ett par enkla exempel på dessa. Definierade efter detta begreppet medelfel och tog ett par enkla exempel på detta.


Ons 20 sep Började med en snabbrepetition av §5 Centrala Gränsvärdessatsen och §6 Approximationer m.h.a. bild på väggen. Avslutade sedan kap 7 med att härleda hur sannolikhetsdefinitionen för Binomialfördelningen övergår i sannolikhetsfunktionen för Poissonfördelningen om p är litet, vilket motiverar att om p<0.1 så gäller att Bin(n,p)~Po(np). Började sedan med kapitel 10 och definierade medelvärde, stickprovsvarians, populationsvarians, variationskoefficient, median, kovarians och korrelationskoefficient, begreppen grupperade data, absolut och relativ frekvens, klassindelade data, histogram och boxplott. Avslutade kapitel 10 med att visa hur man tar fram kvartiler och percentiler. Började sedan kap 11 med att redogöra för skillnaden mellan det riktiga värdet TÄTA, stickprovsvariabeln TÄTA* och punktskattningen TÄTA*obs. Tog som exempel på skattning hur man brukar skatta väntevärdet my och standardavvikelsen sigma vid okänd fördelning. Tog sedan som  ytterligare exempel på skattningar hur man skattar  p i Binomialfördelningen,Hypergeometriska fördelningen och ffg-fördelningen,my och sigma i Poissonfördelningen, lambda i exponentialfördelningen samt my och sigma i Normalfördelningen. Definierade avslutningsvis begreppet konsistent skattning.


Mån 18 sep Inledde med att repetera det mest grundläggande rörande Normalfördelningen. Började sedan med att skriva upp att varje linjärkombination av oberoende Normalfördelade stokastiska varaibler är Normalfördelad. Räknade exempel 6.2a,b som exempel på detta. Fortsatte med att med att gå igenom den viktiga Centrala Gränsvärdessatsen (CGS), som säger att summan av n oberoende likafördelade stokastiska variabler är approximativt normalfördelad om n är stort och att detta även medför att medelvärdet är approximativt normalfördelat. Gjorde sedan exempel 6.6 som exempel på C.G.S. Började sedan med Hypergeometriska fördelningen och skrev upp dess sannolikhetsfunktion. Definierade sedan Binomialfördelningen och skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N<0.1. Visade sedan utgående från Bernoullifördelningen att
villkoret np(1-p)>10 för Normalapproximation egentligen är ett C.G.S.-villkor.Gick sedan igenom begreppet halvkorrektion. Definierade efter detta Poissonfördelningen. Genom att kombinera satsen om att summan av oberoende Poissonfördelade stokastiska variabler är Poissonfördelad med att dela upp intervallet där X är Poissonfördelad i många delintervall visades till sist att  villkoret µ>15  för normalapproximation  egentligen är ett C.G.S.-villkor.

Fre 15 sep
Började med att repetera definitioner och begrepp från föregående föreläsning. Gick sedan igenom räkneregler för kovarianser och skrev upp att C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a. leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att V(X+Y)=V(X)+V(Y) om X och Y är oberoende. Gick därefter igenom följande viktiga räkneregler för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är oberoende V(X+Y)=V(X)+V(Y). Fortsatte med att ta fram väntevärde och standardavvikelse för medelväret av n st ober stokastiska variabler. Skrev sedan upp Stora talens lag. Gick sedan igenom beviset för Markovs olikhet. Använde sedan Markovs olikhet för att bevisa Stora talens lag och Tjebysjevs olikhet. Fortsatte med att skriva upp att uppmätt värde = korrekt värde+ systematiskt fel+ slumpmässigt fel, och att dålig noggrannhet är det samma som stort systematiskt fel medan dålig precision är det samma som stort slumpmässigt fel. Skrev sedan upp täthetsfunktionen och fördelningsfunktionen för normalfördelningen. Skrev efter det upp täthetsfunktionen och fördelningsfunktionen för standardiserade normalfördelningen N(0,1). Skrev sedan upp att om X är N(E[X],D[X]) så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man använder Tabell 1 och Tabell 2 i formelsamlingen och vad alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används. Avslutade med att ta fram k när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2 används.


Mån 11 sep Började med kapitel 5 och startade med att berätta att väntevärdet är vad man får i genomsnitt om man gör oändligt många försök. T.ex. blir ju det genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken,och räknade därigenom ut E(X). Skrev sedan upp definitionen för E(X) resp. E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Gjorde sedan detsamma med E(g(X,Y)). Tog sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter variansen V(X) och standardavvikelsen D(X). Definierade därefter variansen V(X) och standardavvikelsen D(X). Definierade även variationskoefficienten R(X)=D(X)/E(X), och medianen xtilde som definieras av att P(X<xtilde)=0.5. Sedan använde jag mig även här av ex 5.1 i boken för att räkna ut variansen m.h.a. definitionen. Härledde sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade ut samma varians m.h.a. denna formel. Gick sedan igenom följande viktiga räkneregler för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c,  V(aX+b)=V(aX)=a²V(X).  Definierade sedan begreppet kovarians och och begreppet korrelationskoefficient och berättade om dess egenskaper. Visade också att V(X)=C(X,X). Gjorde sedan ex 5.13 i Blom för att visa att X och Y kan vara okorrelerade utan att vara oberoende. Skrev upp att om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0 D.v.s. om X och Y är oberoende så leder det alltid till att X och Y är okorrelerade. Som övning på att räkna ut en kovarians gjorde jag avslutningsvis övningsuppgift 5.18. Visade också här att om X och Y är okorrelerade behöver det inte leda till att X och Y är oberoende.


Ons 6 sep Började med att gå igenom funktioner av stokastiska variabler. Började med att gå igenom det diskreta fallet. Tog exempel 3.16 i Blom. Gick sedan igenom det kontinuerliga fallet. Tog exempel 3.19 och 3.20 i Blom. Började sedan kapitel 4 med att gå igenom flerdimensionella diskreta och kontinuerliga stokastiska variabler. Gick igenom begreppen simultan sannolikhetsfunktion repektive simultan täthetsfunktion och hur man ur dessa får fram den marginella sannolikhetsfunktionen respektive den marginella täthetsfunktionen och hur man vid oberoende även kan gå åt andra hållet. Visade också hur man räknar ut sannolikheter i det två-dimensionella diskreta och kontinuerliga fallet. Fortsatte med att visa hur man tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y. Avslutade kapitel 4 med att som exempel på summa visa att summan av ober Poisonfördelade stok.var. är Poissonfördelad.
 
Mån 4 sep Började med att gå igenom Binomialfördelningen. Fortsatte sedan med med att gå igenom Poissonfördelningen och skrev upp satsen som säger att summan av oberoende Poissonfördelningar också är Poissonfördelad. Tog exempel 7.7 i Blom som exempel på detta. Började sedan med kontinuerliga stokastiska variabler. Definierade täthetsfunktionen och gick igenom hur man ur den får fram Fördelningsfunktionen och vice versa. Gick därefter igenom exponentialfördelningen.Fortsatte med att visa att tiden mellan två händelser är exponentialfördelad om antalet händelser är Poissonfördelat. Visade även att exponentialfördelningen saknar minne.Berättade att eftersom hela kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Gick sedan igenom den likformiga fördelningen och tog som exempel på denna exempel 3.8 och exempel 3.9 i läroboken. Tog till sist exempel 3.14 i läroboken som exempel på en blandad fördelning av diskreta och kontinuerliga stokastiska variabler.

Fre 1 sep Började med att visa ex 2.20 som en intressant tillämpning av Bayes sats. Fortsatte med att visa definitionen för oberoende utgående från betingningsformeln. Tog sedan exempel 2.23 som exempel på oberoende.Inledde sedan kapitel 3 med att gå igenom begreppet stokastisk variabel och definera sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp stolpdiagrammet. Definierade sedan Fördelningsfunktionen och berättade om dess egenskaper. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick sedan igenom ett antal viktiga diskreta fördelningar. Började med tvåpunktsfördelningen och då speciellt Bernouillifördelningen. Fortsatte med den likformiga fördelningen och för-första-gången-fördelningen och den snarlika geometriska fördelningen. Avslutade med att gå igenom hypergeometriska fördelningen.


Tis 29 aug Började med att snabbt repetera fallet dragning med återläggning med hänsyn till ordning, Som exempel på dragning utan återläggning med hänsyn till ordning tog jag sedan en förening med 8 medlemmar som skulle välja ordförande,sekreterare och kassör vilket ger 8 ggr 7 ggr 6 kombinationer. Allmänna fallet n!/(n-k)! kombinationer. Gick sedan igenom dragning utan återläggning utan hänsyn till ordning. Tog som exempel hur många pokergivar det finns. 52!/(5! ggr 47!). D.v.s. 52 över 5 gånger. I allmänna fallet har vi n över k kombinationer. Gick därefter igenom sannolikheten att vid n dragningar utan återläggning utan hänsyn till ordning dra k vita kulor från v vita och s svarta kulor. Utvidgade sedan detta till sannolikheten att dra v vita och; s svarta och g gula o.s.v när man har r färger. Började sedan med betingad sannolikhet. Illustrerade betingningsformeln m.h.a. exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna. Visade även Bayes sats m.h.a. Venndiagram och tog exempel 2.19 som exempel på denna.

 
Mån 28 aug Presenterade först kursens hemsida och visade olika länkar och dess innehåll. Fortsatte sedan med att ge exempel på olika användningsområden som ämnet matematisk statistik har och denna kurs ger en introduktion till. Började sedan med att gå igenom utfall,utfallsrum,händelser.Förklarade därefter skillnaden mellan diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b som exempel på diskreta utfallsrum. Gick sedan igenom snitt, union, komplement och visade hur man med hjälp av Venndiagram räknar ut sannolikheter. Definierade i samband med detta disjunkthet. Resten av tiden ägnades åt kombinatorik. Började med multiplikationsprincipen och den klassiska sannolikhetsdefinitinen. Gick igenom draging med återläggning med hänsyn till ordning och tog som exempel att antal pinkoder blir 10^4 eftersom antal kombinationer när man drar k ggr från n element blir n^k.

  

Sidansvarig: Björn-Olof Skytt
Skapad: 2022-08-21