Aktuell information för kursen
SF1910/SF1925 Tillämpad statistik, 7.5hp, för CSAMH,CLGYM period
2, ht 2019.
Här ges fortlöpande information om schemaändringar, vad som
gåtts igenom på föreläsningar etc.
Scanningsapparaten tillfälligt sönder
Scanningsapparaten är tillfälligt sönder. Detta är orsaken till att
ni inte kunnat se KS-resultaten än.
Instruktion om hur man anmäler sig till lab2
Gå in på personer. Välj en grupp 1-96. Gå in i kalender. Klicka på
"Hitta möte". Välj kurs. Klicka på "Lämna in".Välj tid. Klicka på
"Reservera".
Laboration 2
De som önskar redovisa Laboration 2 måste boka en redovisningstid
senast tisdag 10/12 kl 23.59. Boka laborationstid genom att först
anmäla er till en av de 96 grupper för SF1910/SF1925
Datorlaboration som finns under fliken Personer på Canvassidan.
Boka sedan in er grupp på ett av redovisningspassen i kalendern
för SF1910/SF1925.
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och öppna
Matlab samt ta fram era redovisningsuppgifter.
Ha med er en utskrift av labspecifikationen som ni har skrivit
era personnummer på förstasidan på. Denna utskrift undertecknar
labassistenten efter att han eller hon har godkänt labben och
utskriften fungerar sedan som ert kvitto på resultatet.
Kontrollskrivning
Nu ligger kontrollskrivningen med lösningsförslag ute under båda
länkarna Gamla tentor och KS.
Tider och salar för Räknestugorna
To 28 nov kl 8-10, sal E52
To 5 dec kl 13-15, sal Q31
On 11 dec kl 10-12, sal W37
Sal W37 ligger på Teknikringen 78 på våningsplan 3 och har
rumsnummer 341.
Kontrollskrivning
Kontrollskrivningen Onsdagen 20/11 omfattar kap2-5.
Formel och Tabellsamling
På tentan kommer inte längre egen medhavd Formelsamling
och tabellsamling
i matematisk statistik längre att tillåtas som hjälpmedel. I stället
delas Formelsamling
och tabellsamling
i matematisk statistik ut vid själva tentamenstillfället och lämnas
sedan in igen av tentanden tillsammans med tentan.
BETA ej längre tillåtet hjälpmedel på tentan
På gamla tentor stod att BETA är tillåtet hjälpmedel på
tentan. Observera att BETA ej längre är tillåtet
hjälpmedel på tentan.
Mån 9 dec Började med att berätta när CHI-2-test
används och tog som inledande exempel på detta uppgift 5 på tentan 8
juni 2018. Första timmen ägnades sedan helt åt att grundligt gå
igenom exempel 13.18 i läroboken som exempel på test av given
fördelning där man dels måste skatta minst en parameter ur data (i
detta fall μ) för att skatta p1,p2,.. pr,
dels slå ihop grupper för att villkoret npi≥5 skall gälla
för alla i. Berättade sedan om när homogenitetstest används och tog
som exempel på detta en forskningsrapport där man ville undersöka
huruvida det var någon skillnad mellan 36 timmar gamla pojkar och
flickor vad gällde vad de föredrog att titta på. Berättade efter
detta att man vid oberoendetest kan använda sig av identiskt samma
numerik som man gör vid homogenitetstest. Visade uppgift 5 på tentan
2017-01-09 som exempel på detta.
Ons 4 dec Inledde med att som repitition skriva upp
samma lista som föregående föreläsning på viktiga definitioner och
begrepp som används inom hypotesprövning, såsom
nollhypotes,mothypotes, risknivå, p-värde, och styrka.Fortsatte
sedan sedan med exempel 13.8 och gjorde nu hypotesprövning i
fallet ensidigt test, dels med kofidensintervallmetoden dels med
testvariabelmetoden. Detta gjordes med olika värden på risknivån ?
och m.h.a. detta visades också i vilket intervall p-värdet måste
ligga. Gjorde sedan övningsuppgift 13.21a för att visa hur man tar
fram styrkan hos ett test när man har använt sig av
konfidensintervallmetoden. Utifrån detta visades även hur man tar
fram styrkefunktionen - i detta fall h(?) där ? =?x-?y.
Gick sedan igenom linjär regression och visade att parametrarna ?
och ? skattas med Minsta-kvadrat-metoden. Fortsatte med att visa hur
man i multipel regression m.h.a. nollhypotesen H0 :?i
=0 kan avgöra om man ska kasta respektive oberoende variabel xi
eller ej. Gjorde övningsuppgift 14.7a som exempel på detta.
Avslutade med att skissa några exempel där man med hjälp av
residualanalys kan avgöra huruvida det är troligt att y beror
linjärt av x.
Tis 3 dec Inledde med att skriva upp en lista på
viktiga definitioner och begrepp som används inom hypotesprövning,
såsom nollhypotes,mothypotes, risknivå, p-värde, och styrka.Gick
därefter igenom exempel 13.1 i läroboken som exempel på ett fall där
man inte använder konfidensintervall för att testa sin
nollhypotes.Fortsatte därefter med exempel 13.4 i läroboken, där man
tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9,
och tog även fram styrkefunktionen h(p) i detta fall.Började sedan
med exempel 13.8 och gjorde hypotesprövning i fallet tvåsidigt test,
dels med konfidensintervallmetoden dels med testvariabelmetoden.
Detta gjordes med olika värden på risknivån ? och m.h.a. detta
visades också i vilket intervall p-värdet måste ligga. Hann sedan
göra hypotesprövning i fallet ensidigt test med
konfidensintervallmetoden innan det var dags att sluta.
Fre 29 nov Började med att repetera konfidensintervallet för
skillnaden mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och lika och hur man m.h.a. §11.2
viktar ihop de två stickprovsvarianserna för att få en skattning s
av standardavvikelsen. Efter detta visades det viktiga fallet när
man har parvisa observationer-"stickprov i par"- och att
konfidensintervallet för väntevärdet av de parvisa skillnaderna då
tas fram som om man har ett stickprov av parvisa skillnader. Som
exempel på "Skillnad mellan stickprov" visades tentatal
2019-06-05:15 och som exempel på "Stickprov i par" visades tentatal
2019-08-12:15. Gick sedan igenom konfidensintervall med approximativ
konfidensgrad där §12.3 används. Visade att om stickproven är så
stora så att C.G.S. kan användas, så kan man bilda
konfidensintervall med approximativ konfidensgrad för väntevärden
och skillnader mellan väntevärden även om observationerna inte
kommer från en Normalfördelning. Avslutade kapitel 12 med att visa
konfidensintervall med approximativ konfidensgrad för p när X
tillhör Bin(n,p), för py- px när Y tillhör Bin(ny,py) och X tillhör
Bin(nx,px) samt för my i Poisson-fördelningen och att det i alla
dessa fall förutsätter att Normalapproximation är möjlig enligt
villkoren i §5 respektive §6. Tog därefter fram konfidensintervallet
för standardavvikelsen utgående från §12.4 i Formelsamlingen. Visade
utgående från detta konfidensintervall hur konfidensintervallet för
variansen ser ut. Visade också utgående från det tvåsidiga
konfidensintervallet för standardavvikelsen hur man tar fram det
ensidiga.
Ons 27 nov Började med att gå igenom Minsta kvadrat-metoden
genom att skriva upp den formel för Q som ska minimeras som står i
§9.2 . Tog sedan ett eget exempel där man vill skatta ytan av en
kvadrat genom att mäta upp sidans längd och diagonalens längd. Tog
sedan exempel 11.19 i läroboken som exempel på hur
Minsta-kvadrat-skattning går till när två saker ska
skattas.Definierade därefter begreppen konfidensintervall och
konfidensgrad i allmänna fallet. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en
Normalfördelning där standardavvikelsen är känd.Visade också hur man
får samma konfidensintervall m.h.a.§12.1. Visade utgående från detta
exempel hur man generellt bildar ensidigt nedåt begränsade och
ensidigt uppåt begränsade konfidensintervall. Visade sedan m.h.a.
§12.2 hur det tvåsidiga konfidensintervallet för väntevärdet ser ut
när mätdata kommer från en Normalfördelning där standardavvikelsen
är okänd.Därefter visades m.h.a §12.1 och §11.3 konfidensintervallet
för skillnaden mellan väntevärdena hos två Normalfördelade stickprov
där standardavvikelserna är kända. Därefter visades m.h.a.§12.2
konfidensintervallet för skillnaden mellan väntevärdena hos två
Normalfördelade stickprov där standardavvikelserna är okända och
lika och hur man m.h.a. §11.2 viktar ihop de två
stickprovsvarianserna för att få en skattning s av
standardavvikelsen.Sedan visades hur man m.h.a.§12.3 bildar ett
konfidensintervall med approximativ konfidensgrad för skillnaden
mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och olika.
Mån 25 nov Började kap 11 med att redogöra för skillnaden
mellan det riktiga värdet TÄTA,stickprovsvariabeln TÄTA* och
punktskattningen TÄTA*obs. Tog som exempel på skattning hur man
brukar skatta väntevärdet my och standardavvikelsen sigma vid okänd
fördelning. Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa. Tog sedan som
ytterligare exempel på skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen.Definerade sedan begreppet medelfel och tog
som exempel på detta skattningarna av andel i Binomialfördelningen
och ? i Poissonfördelningen. Definierade begreppet konsistens.
Presenterade därefter Maximum-Likelihood-metoden och räknade exempel
11.10 i läroboken som exempel på denna.
Mån 18 nov Började med kap 10 och definierade medelvärde,
stickprovsvarians, populationsvarians, variationskoefficient,
median, kovarians och korrelationskoefficient.Gjorde
övningsuppgifterna 10.2b 0ch 10.7 som exempel på hur man tar fram
medelvärde, stickprovsstandardavvikelse och korrelationskoefficient
utgående från givna data. Gick sedan igenom begreppen grupperade
data,absolut och relativ frekvens, klassindelade data,histogram och
boxplott.Avslutade kapitel 10 med att visa hur man tar fram
kvartiler och percentiler.Fortsatte sedan med att skriva upp en
lista på viktiga definitioner och begrepp som används inom
hypotesprövning såsom nollhypotes,mothypotes, risknivå, och
p-värde.Gick sedan igenom linjär regression. Visade sedan hur man i
multipel regression m.h.a. nollhypotesen H0 : beta i
=0 kan avgöra om man ska kasta respektive oberoende variabel xi
eller ej. Avslutade med övningsuppgift 14.7 som exempel på detta.
Tor 14 nov Började med att göra exempel 6.2a,b som exempel på
att varje linjärkombination av oberoende N-fördelade slumpvariabler
är normalfördelad.Fortsatte med att gå igenom den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt normalfördelad
om n är stort, och att detta även medför att medelvärdet är
approximativt normalfördelat. Presenterade sedan den viktiga
Centrala Gränsvärdessatsen (CGS), som säger att summan av n
oberoende likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort, och att detta även medför att
medelvärdet är approximativt normalfördelat. Avslutade kapitel 6 med
att göra Exempel 6.6 som exempel på Centrala Gränsvärdessatsen.
Definierade sedan Hypergeometriska fördelningen och skrev upp dess
sannolikhetsfunktion. Definierade sedan Binomialfördelningen och
skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~
Bin(n,p) om n/N<0.1. Visade sedan utgående från
Bernoullifördelningen att villkoret np(1-p)>10 för
Normalapproximation egentligen är ett C.G.S.-villkor. Fortsatte med
att gå igenom halvkorrektion. Definierade efter detta
Poissonfördelningen. Avslutade kap 7 med att berätta att
sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet, vilket
motiverar att om p<0.1 så gäller att Bin(n,p)~Po(np).
Ons 13 nov Definierade E[g(X,Y)]. Som övning på att
räkna ut en kovarians slutförde jag sedan övningsuppgift 5.18a och
b. Gick sedan igenom räkneregler för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
m.h.a. att V(X)=C(X,X) leder till den viktiga regeln att
V(X+Y)=V(X)+V(Y)+2C(X,Y) och att V(X+Y)=V(X)+V(Y) om X och Y är
oberoende. Började efter det med kap 6 Normalfördelningen. Skrev
först upp täthetsfunktionen och fördelningsfunktionen för
normalfördelningen. Skrev efter det upp täthetsfunktionen och
fördelningsfunktionen för standardiserade normalfördelningen N(0,1).
Skrev sedan upp att om X är N(E[X],D[X]) så gäller att
Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man
använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X]) för
k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och
visade sedan på väggen även sannolikheterna för att ett utfall
hamnar minst två respektive tre standardavvikelser ifrån
väntevärdet. Avslutade med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2
används och pekade på tabell 2 för att visa vad k ungefär blir när
sannolikheterna är 0.99 och 0.999.
Mån 11 nov Började med kapitel 5 och startade med att
berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet av
ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev sedan
upp definitionen för E(X) resp. E(g(X)) i det diskreta fallet och
det kontinuerliga fallet. Tog sedan och räknade ut E(X²) i Ex. 5.1 i
boken.Definierade även medianen för X. Definierade därefter
variansen för X och standardavvikelsen D(X). Definierade även
Variationskoefficienten. Sedan använde jag mig även här av ex 5.1 i
boken för att räkna ut variansen m.h.a. definitionen. Härledde sedan
ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade ut samma
varians m.h.a. denna formel. Gick avslutningsvis igenom följande
viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c, V(aX+b)=V(aX)=a²V(X), samt om X och Y är
oberoende: V(X+Y)=V(X)+V(Y).Tog därefter fram väntevärde och
standardavvikelse för medelväret av n st ober stokastiska variabler.
Avslutade första timmen med att skriva upp Stora talens lag.
Definierade sedan begreppet kovarians och visade att V(X)=C(X,X).
Definerade sedan begreppet korrelationskoefficient och berättade om
dess egenskaper. Visade att om X och Y är oberoende så leder det
till att E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0,
d.v.s. att X och Y är okorrelerade. Visade sedan att omvändningen
inte behöver vara sann genom att göra exempel 5.13 i läroboken. Som
övning på att räkna ut en kovarians gjorde jag till sist
övningsuppgift 5.18a.
Tors 7 nov Började med att gå igenom funktioner av
stokastiska variabler. Tog som exempel i det diskreta fallet exempel
3.16 i Blom och som kontinuerliga exempel gjorde jag exempel 3.20
och exempel 3.19 i Blom. Fortsatte med att gå igenom
flerdimensionella diskreta och kontinuerliga stokastiska variabler.
Gick igenom begreppen simultan sannolikhetsfunktion repektive
simultan täthetsfunktion och hur man ur dessa får fram den
marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade sedan hur man räknar ut sannolikheter i det
två-dimensionella diskreta och kontinuerliga fallet.Fortsatte med
att visa hur man tar fram Fördelningsfunktionen för max(X,Y) och
min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y.
Gjorde ex 4.9 som exempel på summa av två diskreta ober stok.var.
Visade i och med detta den viktiga satsen att summan av ober
Poissonfördelade stok.var. är Poissonfördelad. Avslutade med
övningsuppgift 4.23 för att visa hur man löser problem av typ summa
av två ober stok.var. i kontinuerliga fallet.
Tis 5 nov Började med att gå igenom Binomialfördelningen och
Poissonfördelngen och att summan av två oberoende Poissonfördelade
stokastiska variabler är Poissonfördelad. Tog exempel 7.7 som
exempel på detta. Fortsatte sedan med kontinuerliga stokastiska
variabler. Definierade täthetsfunktionen och gick igenom hur man ur
den får fram Fördelningsfunktionen och vice versa. Gick därefter
igenom exponentialfördelningen.Fortsatte med att visa att tiden
mellan två händelser är exponentialfördelad om antalet händelser är
Poissonfördelat. Visade även att exponentialfördelningen saknar
minne.Gick sedan igenom den likformiga fördelningen och tog som
exempel på denna exempel 3.9 i läroboken.Berättade att eftersom hela
kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Avslutade
med att som exempel på blandad(diskret och kontinuerlig) fördelning
gå igenom exempel 3.14
Ons 30 okt Inledningsvis visade jag Bayes sats
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna. Visade
sedan definitionen för oberoende utgående från betingningsformeln.
Avslutade kapitel 2 med exempel 2.23 som exempel på
oberoende.Inledde kapitel 3 med att gå igenom begreppet stokastisk
variabel och definera sannolikhetsfunktionen. Tog som exempel på
denna ex 3.1 i läroboken och ritade även upp stolpdiagrammet.
Definierade sedan Fördelningsfunktionen och berättade om dess
egenskaper. Tog som exempel på denna ex 3.1 i läroboken och ritade
även upp den. Gick sedan igenom ett antal viktiga diskreta
fördelningar. Började med tvåpunktsfördelningen och då speciellt
Bernoullifördelningen. Fortsatte med den likformiga fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom den hypergeometriska
fördelningen. Binomialfördelningen och Poissonfördelningen hanns ej
med och gås igenom på nästa föreläsning.
Tis 29 okt Började med fallet dragning med återläggning med
hänsyn till ordning. Fortsatte med fallet dragning utan återläggning
med hänsyn till ordning. Gick sedan igenom fallet dragning utan
återläggning utan hänsyn till ordning. Gick därefter igenom
sannolikheten att vid n dragningar utan återläggning utan hänsyn
till ordning dra k vita kulor från v vita och s svarta kulor.
Utvidgade sedan detta till sannolikheten att dra v vita och; s
svarta och g gula o.s.v när man har r färger. Började sedan med
betingad sannolikhet. Illustrerade betingningsformeln m.h.a.
exemplet på sid 26 i läroboken. Visade lagen om total sannolikhet
m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna.
Mån 28 okt Presenterade först kursens hemsida som hittas på
http://www.math.kth.se/matstat/gru (och på canvas) och visade olika
länkar och dess innehåll. Fortsatte sedan med ge exempel på olika
användningsområden som ämnet matematisk statistik har och denna kurs
ger en introduktion till. Började sedan med att gå igenom
utfall,utfallsrum,händelser.Förklarade därefter skillnaden mellan
diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b
som exempel på diskreta utfallsrum. Gick sedan igenom snitt, union,
komplement och visade hur man med hjälp av Venndiagram räknar ut
sannolikheter. Definierade i samband med detta disjunkthet. På
slutet av föreläsningen presenterades inledningen av kombinatoriken.
Hann med den klassiska sannolikhetsdefinitionen och
multiplikationsprincipen.
|