Aktuell information

Tentamen

Tentamen är nu rättad. Statistisk över resulatet.

Kursutvärdering

En kursutvärdering har genomförts.

Schemaproblem

OBS! Schemat i Daisy innehåller också tider för kursen för D på centrala campus. Det är schemat i kursmappen som gäller.

Inlämningsuppgifter

Inlämningsuppgifterna är nu färdiga.

Ursprungliga versionen hade några förargliga tryckfel och en rättad version finns för nerladdning. En tryckt version delas också ut i samband med övningar och föreläsningar.

Material delas ut med början på föreläsningen 6/9. Observera att du måste få ett eget unikt elevnummer genom att få ett datablad av föreläsaren.

Notera att datablad finns att ladda ner om man tappat bort sitt datablad men kommer ihåg elevnumret.

Det finns nu även lite tips och kommentarer kring inlämningsuppgifterna.

OBS! Inlämningsuppgifter har nu skickats till Studentexpeditionen i Forum och kan hämtas ut där.


Föreläsningsinformation

  • [2006-11-21] Gav lite tips angående 4:e inlämningsuppgiften.

    Avslutning om köteori med motiveringar till Littles formler som gör att kunskap av en av

    • l=förväntat antal i systemet
    • lq=förväntat antal i kön
    • w=förväntad tid i systemet
    • wq=förväntad tid i kön
    ger de övriga. Formelsamlingen innehåller uppgifter om lq för ett antal kösystem.

    Lite om M/G/1-köer samt om Jackson-nätverk, dvs system av kopplade köer.

    Bilder

    Ungefärligt innehåll

  • [2006-11-14] Tolkning av övergångsintensitetsmatris Q. Tog fram den för M/M/1-kön, dvs med Poisson-ankomster dvs enligt en Po(λ)-process, och en betjäningsstation med Exp(μ)-fördelad betjäningstid. Lite om absorbtion vad gäller förväntad tid till absorption och sannolikhetsfördelning för var kedjan absorberas.

    Begreppet stationär fördelning och ergodisk process. Födelse-processer samt födelse-dösprocesser. Tog fram algoritmen för att lösa 0=πQ i fallet födelse-dödsprocess. Villkor för ergodicitet. Behandlade vidare M/M/2-kön, dvs då man har totalordnad kö och två parallella betjäningsstationer.

    Användning av cykler för ergodiska processer.

    Bevis för att man stryka godtycklig ekvation (utom normeringsekvationen) då man söker stationärfördelning.

    Bilder

    Ungefärligt innehåll

  • [2006-11-03] Fortsättning om Markovkedjor i kontinuerli tid. Begreppet övergångsintensitetsmatris Q och egenskaper hos denna samt hur den kan användas för att få övergångssannolikheter P(t) genom kopplade differentialekvationer. Lite exempel på hur enkelt det är att ta fram Q samt hur elementen i Q kan tolkas.

    Stationaritet och ergodicitet för kontinuerlig tid.

    Lite om Poisson-process som modell "fullständigt slumpmässighet i tiden".

    Bilder

    Ungefärligt innehåll.

  • [2006-11-03] Avslutning om Markovkedjor i diskret tid och framför allt villkor för ergodicitet. Lite om kedjor med oändligt många tillstånd (kan försvinna ut i oändligheten) samt om det allmänna uppträdandet av ändliga kedjor.

    En olikhet som visar att konvergensen mot asymptotisk fördelning sker mycket snabbt.

    Ett bevis för att det räcker med en fylld kolumn för att visa ergodicitet.

    Ett bevis för att man kan stryka en godtycklig ekvation då man söker asymptotisk fördelning.

    Om användning av cykler i ergodiska kedjor för att få andelar som kedjan till bringar i olika tillstånd.

    Inledning om kontinuerlig tid. Markovegenskapen och Chapman-Kolmogorovs ekvationer. Obetingade sannolikheter och hur dessa fås ur initialfördelning och övergångsmatris.

    Lite egenskaper hos exponentialfördelningen t ex minneslöshet, felintensitet och tolkning avc denna samt vad som händer vid minimibildning av oberoende exponentialfördelningar. Ett för att minimum av exponentialfördelade och vilken som är minst är oberoende.

    Lite om simuleringsmetoden Markov Chain Monte Carlo (MCMC).

    Bilder

    Ungefärligt innehåll.

  • [2006-10-30] Fortsättning om Markovkedjor i diskret tid. Avslutade Exempel 16 med analys av tid till absorption.

    Lite om huvudproblemet: Vad händer då n → ∞? Ofta konvergerar fördelningen mot en unik fördelning oavsett hur kedjan startar. Kedjan kallas då ergodisk.

    Begreppet stationär fördelning. Sats om att om kedjan har ändligt många tillstånd finns minst en stationär fördelning.

    Naturlig fråga är då att få villkor för att det bara skall finnas en enda stationär fördelning. För detta behövs en analys av kommunikationen inom kedjan.

    Begreppen i→j (i leder till j), i↔j (i kommunicerar tvåsidigt med j, dvs i→j och j→i.

    Lite om det matematiska begreppet "ekvivalensrelation" och att ↔ utgör en ekvivalensrelation på tillståndsrummet E. Begreppet sluten delklass (inga möjligheter att komma ur delklassen), begreppet minimalt sluten delklass (sluten, men inga tillstånd kan strykas utan att slutenheten försvinner), samt begreppet irreducibel delklass (alla tillstånd kommunicerar tvåsidigt).

    Bevis för att en ändlig kedja alltid har minst en sluten irreducibel delklass.

    Begreppet period för ett tillstånd (dvs största faktorn i alla utflyktslängder). Ett bevis för att två tillstånd som kommunicerar tvåsidigt har samma period.

    Huvudresultatet att en ändlig, irreducibel aperiodisk Markovkedja är ergodisk.

    Bilder

    Ungefärligt innehåll.

  • [2006-10-27] Inledning om Markovprocesser. Lite allmänt om stokastiska processer. Markov-egenskapen samt övergångssannolikheter och övergångsmatris. Chapman-Kolmogorovs ekvationer. Tillämpning på problem 16 i exempelsamlingen som inkluderade begreppet absorptionskedja.

    Bilder

    Ungefärligt innehåll.

  • [2006-10-26] Om χ2-test i form av test av given fördelning. Visade att teststorheten Q har väntevärde r-1 oavsett antalet försök och de postulerade sannolikheterna. Genomförde test av om data om ihjälsparkade kavallerister (Exempel 13.18 i läroboken) kommer från en Poisson-fördelning.

    Behandlade homogenitetstest (kontingenstabeller) i form av ett exempel om analys av skillnaden mellan nyfödda pojkar och flickor vad gäller intresse för ansikten. Se tabell 1 i bifogade vetenskapliga artikel Sex differences in human neonatal social perception.

    Lite om enkel linjär regression enligt kapitel 14 med lite utblickar mot polynomregression och multipel regression.

    Bilder

    Ungefärligt innehåll.

    I morgon börjar vi med Markovdelen.

  • [2006-10-12] Kapitel 13 om hypotesprövning, dvs "statistisk bevisning". Allmänt om begreppen nollhypotes, alternativhypotes, testvariabel och kritiskt område. Detta illustrerades med exemplet test av astrologer. Begreppen "fel av 1:a slaget" (α-felet) dvs att förkasta H0 då H0 är sann samt "fel av 2:a slaget" dvs att inte förkasta H0 då H1 är sann. Begreppet styrkefunktion. Gav exemplet rattfylleri som ytterligare illustration av dessa begrepp. Kopplingen med konfidensintervall, den s k konfidensmetoden.

    Inledning om χ2-test i form av test av given fördelning med illustration från test av tärning.

    Nästa gång behandlas homogenitetstest (kontingenstabeller) i form av ett exempel om analys av skillnaden mellan nyfödda pojkar och flickor vad gäller intresse för ansikten. Se tabell 1 i bifogade vetenskapliga artikel Sex differences in human neonatal social perception. Dessutom behandlas enkel linjär regression (Kapitel 14).

    Bilder

    Ungefärligt innehåll.

  • [2006-10-09] Fortsättning om kapitel 12 om konfidensintervall. Fallet ett normalfördelat stickprov med okänd spridning gicks igenom vad gäller konfidensintervall för väntevärde och standardavvikelse. Finns ett allmänt räkneschema för att konstruera konfidensintervall.

    Lite om enkelsidiga intervall där man byter α/2 mot α i ena gränsen och låter den andra gränsen vara trivial.

    Fallet två oberoende stickprov gicks igenom dels utan några som helst fördelningsantaganden (utnyttjande CGS) samt om man antar normalfördelning med kända standardavvikelser samt med samma (men okända) spridning σ i båda stickproven. Detta kontrasterades mot situationen "parvisa observationer" där man bildar skillnader inom varje par och analyserar dessa skillnader som "ett stickprov".

    Lite om t-fördelningen och om hur man gör exakta konfidensintervall för μ då data kommer från en N(μ,σ)-fördelning där både μ och σ är okända.

    Se gärna följande godis om hur man beräknar konfidensintervall med formelsamlingen samt en allmän metod att beräkna konfidensintervall.

    Man kan även beräkna konfidensintervall för medianen i en fördelning och det går att ta fram exakta konfindensintervall för parametrarna i binomialfördelningen och Poisson-fördelningen.

    Bilder

    Ungefärligt innehåll.

  • [2006-10-02] Repeterade grundläggande begrepp vad gäller punktskattningar. Lyfte fram det viktiga medelfelsbegreppet och i samband med detta den ofta använda men något skumma metoden med "felfortplantning" (avsnitt 11.10) i läroboken som i princip innebär en linearisering av skattningen.

    Inledning om kapitel 12 om Intervallskattningen (eller konfidensintervall eller osäkerhetsintervall). Ett enkelt exempel med normalfördelad skattning med känd standardavvikelse.

    Gick igenom den i praktiken mycket använda och användbara "approximativa metoden" enligt formelsamlingen 12.3. Där har man en skattning som betraktas som approximativt normalfördelad och där man skattar standardavvikelsen med medelfelet. Konfidensintervallet (95%-igt) blir då "skattning"±1.9600×"medelfel". Detta tillämpades på en opinionsundersökning.

    Bilder

    Ungefärligt innehåll.

  • [2006-09-25] Kapitel 11 om punktskattningar. Inledning med utgångspunkt i ett exempel om opinionsundersökningar som introducerade begreppen parameter, punktskattning, modell för data, stickprovsvariabel, väntevärdesriktighet, effektivitet och medelfel.

    Satsen att om data är oberoende och likafördelade så skattar aritmetiska medelvärdet väntevärdet

    • väntevärdesriktigt
    • konsistent
    • det kan finnas effektivare skattningar

    Ett exempel på att det kan finnas effektivare skattningar (alltså med mindre varians) än det aritmetiska medelvärdet. Sats om skattning av standardavvikelse då data är oberoende och likafördelade.

    Maximum Likelihoodmetoden gicks igenom med ett exempel med Poisson-fördelade mätvärden. Idén bakom ML-metoden är att använda som skattning det värde på parametern som gör de erhållna mätdata så sannolika som möjligt. Notera knepet att logaritmera! Lite slarvigt kan man säga att ML-skattningar är de bästa tänkbara.

    Minsta kvadratmetoden illustrerades med ett exempel om anpassning av rät linje till tvådimensionella data (enkel linjär regression).

    Bilder

    Ungefärligt innehåll.

    För den intresserande ges här en (något krävande) genomgång av teoretisk statistik och teorin för "bästa tänkbara skattningar".

    Det finns ett annat angreppssätt på statistisk inferens nämligen Bayesiansk statistik där man uttrycker sin osäkerhet om parametrars värde som sannolikhetsfördelningar.

  • [2006-09-18]

    Lite avslutning om kapitel 6 om normalfördelning samt lite avskräckande exempel på vantolkning av CGS som t ex relativa betyg och intelligenskvot.

    För den intresserade är här lite material om bevis av CGS med hjälp av momentgenererande funktion (Laplace-transform) samt med hjälp av karaktäristisk funktion, dvs Fourier-transformen φX(t)=E(eitX).

    Kapitel 7 om binomialfördelningen och deras släktingar, dvs diskreta sannolikhetsmodeller.

    Bland annat visades att summor av oberoende Poisson är nya poissonfördelningar, och approximationer fördelningarna emellan samt normalapproximationer. Notera att vi kräver att ni lär er modellsituationerna för för binomial, ffg och hypergeometrisk fördelning.

    Exempel:

    Feluppskattning för approximation av binomial- med Poisson-fördelning som motiverar varför Poisson-fördelning är så vanlig som modell för "sällsynta händelser".

    En lustig och klassisk illustration om antalet ihjälsparkade kavallerister. Det sista med utgångspunkt från (den något förvirrade och okunniga) boken "The roots of coincidence" av Arthur Koestler.
    För approximationer: se jämförelserna mellan Bin(25,0.2)-fördelning och Po(5), Bin(50,0.1)-fördelning och Po(5) samt mellan Bin(500,0.01)-fördelning och Po(5).

    Kapitel 8 om simulering ingår ej. Kapitel 9 läses kursivt. Kapitel 10 läses också kursivt förutom avsnittet om läges- och spridningsmått.

    Inledning om det viktiga kapitel 11 om punktskattningar med utgångspunkt i exemplet om opinionsundersökning beskrivet i avsnitt 11.2 i läroboken.

    Bilder

    Ungefärligt innehåll.

  • [2006-09-14] Lite mer om korrelationskoefficient och hur den kan vantolkas.

    Kapitel 6 om den viktiga normalfördelningen. med huvudresultatet att linjärkombinationer av oberoende normalfördelade stokastiska variabler är normalfördelad. Dessutom det viktiga resultatet att om X är N(μ,σ) är (X-μ)/σ standardiserat normalfördelad, dvs N(0,1), som innebär att alla sannolikhetsberäkningar om allmän normalfördelning kan återföras på en sannolikhetsberäkning med N(0,1)-fördelningen.

    Som varning: summan av beroende normalfördelade behöver inte vara normalfördelad ens när de är okorrelerade.

    Centrala gränsvärdessatsen som visar att (lite slarvigt uttryckt) summan av "många", "ungefär" oberoende och "ungefär" likafördelade är "ungefär" normalfördelad. Detta har stora tillämpningar för approximativa beräkningar och är dessutom viktigt för att motivera att mätfel oftast antas vara normalfördelade.

    Ett exempel på Centrala gränsvärdessatsen är summan av 100 tärningskast samt hur man får fram fördelningen med hjälp av den s k sannolikhetsgenererande funktionen gX(t)=E(tX).

    Bilder

    Ungefärligt innehåll.

  • [2006-09-11] Kapitel 5 om väntervärden. Lägesmått och spridningsmått. Räkneregler för väntevärde och varians. Stora talens lag. Lite om beroendemått.

    Bilder

    Ungefärligt innehåll.

  • [2006-09-06] Inlämningsuppgifterna delades ut.

    Funktioner av stokastiska variabler (Avsnitt 3.10 i läroboken).

    Kapitel 4 om fler-dimensionella stokastiska variabler med tyngdpunkt på fallet med oberoende stokastiska variabler. Fördelningen för maximum och minimum av oberoende stokastiska variabler.

    Inledning om kapitel 5 om väntevärden och om tolkningar av väntevärden. Sats om hur E(g(X)) kan beräknas. Definition av spridningsmåttet varians.

    Bilder

    Ungefärligt innehåll.

  • [2006-09-04] Kapitel 3 om stokastiska variabler. Enkla exempel med härledningar av på diskreta stokastiska variabler, dvs sådana som kan anta ett ändligt (eller uppräkneligt oändligt) antal olika värden.

    Kontinuerlig fördelning, dvs där sannolikhetsmassan fördelats på reella axeln med en sannolikhetstäthet.

    Begreppet fördelningsfunktion och hur det kan användas för beräkning av sannolikheten att hamna i ett intervall.

    Bilder

    Ungefärligt innehåll.

    Se gärna följande om uppkomstsätt för för-första-gången-, binomial- och hypergeometrisk fördelning.

  • [2006-09-01]

    Urnmodeller vid dragning utan återläggning (avsnitt 2.5 a sid 24) samt vid dragning med återläggning (avsnitt 2.5 b sid 25) som tillämpningar på kombinatorik. Dyker upp senare i kapitel 7 som Hypergeometrisk fördelning och binomialfördelning som har stora tillämpningar på bl a opinionsundersökningar.

    Här kan man läsa om det fjärde uteslutna fallet med dragning med återläggning utan hänsyn till ordning.

    Betingad sannolikhet (avsnitt 2.6) samt Lagen om total sannolikhet och Bayes' sats med tillämpningar på bl a diagnostiska test.

    Begreppet oberoende.

    Ungefärligt innehåll.

  • Se gärna godiset : Monty Halls problem (bilen och getterna) och Persi Diaconis videoföredrag från Princeton On coincidences. Här en nyhetsartikel om ett föredrag av Persi Diaconis om slantsingling.

  • [2006-08-31]

    Kapitel 2 i läroboken:

    Grundläggande terminiologi: slumpförsök, utfallsrum, utfall, händelser. Tolkningar av mängdoperationer som händelser. Kolmogorovs axiom. Konstruktion av sannolikhetsmått för diskreta utfallsrum i synnerhet likformig fördelning för ändliga utfallsrum. Lite om kombinatorik.

    Bilder.

    Ungefärligt innehåll.


[Kurshemsidan]     [Kursförteckning]     [Avdelningen Matematisk statistik]
Sidansvarig: Gunnar Englund
Uppdaterad: 2006-08-24