Lite om absorbtion vad gäller förväntad tid till absorption och sannolikhetsfördelning
för var kedjan absorberas.
Begreppet stationär fördelning och ergodisk process. Födelse-processer samt
födelse-dösprocesser. Tog fram algoritmen för att lösa 0=πQ i fallet
födelse-dödsprocess. Villkor för ergodicitet. Behandlade vidare M/M/2-kön, dvs då man har
totalordnad kö och två parallella betjäningsstationer.
Användning av cykler för
ergodiska processer.
Bevis för att man stryka
godtycklig ekvation (utom normeringsekvationen) då man söker stationärfördelning.
Bilder
Ungefärligt innehåll
[2006-11-03]
Fortsättning om Markovkedjor i kontinuerli tid. Begreppet övergångsintensitetsmatris Q
och egenskaper hos denna samt hur den kan användas för att få övergångssannolikheter
P(t) genom kopplade differentialekvationer. Lite exempel på hur enkelt det är
att ta fram Q samt hur elementen i Q kan tolkas.
Stationaritet och ergodicitet för kontinuerlig tid.
Lite om Poisson-process som modell "fullständigt slumpmässighet i tiden".
Bilder
Ungefärligt innehåll.
[2006-11-03]
Avslutning om Markovkedjor i diskret tid och framför allt villkor
för ergodicitet. Lite om kedjor med oändligt många tillstånd (kan försvinna
ut i oändligheten) samt om det allmänna uppträdandet av ändliga kedjor.
En olikhet som
visar att konvergensen mot asymptotisk fördelning sker mycket snabbt.
Ett bevis för att det räcker
med en fylld kolumn för att visa ergodicitet.
Ett bevis för att man kan stryka
en godtycklig ekvation då man söker asymptotisk fördelning.
Om användning av cykler
i ergodiska kedjor för att få andelar som kedjan till bringar i olika tillstånd.
Inledning om kontinuerlig tid. Markovegenskapen och Chapman-Kolmogorovs
ekvationer. Obetingade sannolikheter och hur dessa fås ur initialfördelning
och övergångsmatris.
Lite egenskaper hos exponentialfördelningen t ex minneslöshet, felintensitet
och tolkning avc denna samt vad som händer vid minimibildning av
oberoende exponentialfördelningar. Ett för att minimum av exponentialfördelade och vilken som är minst är oberoende.
Lite om simuleringsmetoden Markov Chain Monte Carlo (MCMC).
Bilder
Ungefärligt innehåll.
[2006-10-30]
Fortsättning om Markovkedjor i diskret tid. Avslutade Exempel 16 med analys av tid till
absorption.
Lite om huvudproblemet: Vad händer då n → ∞? Ofta konvergerar fördelningen
mot en unik fördelning oavsett hur kedjan startar. Kedjan kallas då ergodisk.
Begreppet stationär fördelning. Sats om att om kedjan har ändligt många tillstånd finns
minst en stationär fördelning.
Naturlig fråga är då att få villkor för att det bara skall finnas en enda stationär fördelning.
För detta behövs en analys av kommunikationen inom kedjan.
Begreppen i→j (i leder till j), i↔j (i kommunicerar tvåsidigt med j, dvs
i→j och j→i.
Lite om det matematiska begreppet "ekvivalensrelation" och att ↔ utgör en ekvivalensrelation
på tillståndsrummet E.
Begreppet sluten delklass (inga möjligheter att komma ur delklassen), begreppet minimalt
sluten delklass (sluten, men inga tillstånd kan strykas utan att slutenheten försvinner), samt
begreppet irreducibel delklass (alla tillstånd kommunicerar tvåsidigt).
Bevis
för att en ändlig kedja alltid har minst en sluten irreducibel delklass.
Begreppet period för ett tillstånd (dvs största faktorn i alla utflyktslängder).
Ett bevis för att två
tillstånd som kommunicerar tvåsidigt har samma period.
Huvudresultatet att en ändlig, irreducibel aperiodisk Markovkedja är ergodisk.
Bilder
Ungefärligt innehåll.
[2006-10-27]
Inledning om Markovprocesser. Lite allmänt om stokastiska processer. Markov-egenskapen samt övergångssannolikheter och övergångsmatris. Chapman-Kolmogorovs ekvationer. Tillämpning på problem 16 i exempelsamlingen som inkluderade begreppet absorptionskedja.
Bilder
Ungefärligt innehåll.
[2006-10-26]
Om χ2-test i form av test av given fördelning.
Visade att teststorheten Q har väntevärde r-1 oavsett antalet försök
och de postulerade sannolikheterna. Genomförde test av om data om ihjälsparkade
kavallerister (Exempel 13.18 i läroboken) kommer från en Poisson-fördelning.
Behandlade homogenitetstest (kontingenstabeller) i form av ett exempel
om analys av skillnaden mellan nyfödda pojkar och flickor vad
gäller intresse
för ansikten. Se tabell 1 i bifogade vetenskapliga artikel Sex differences in human neonatal social perception.
Lite om enkel linjär regression enligt kapitel 14 med lite utblickar mot
polynomregression och multipel regression.
Bilder
Ungefärligt innehåll.
I morgon börjar vi med Markovdelen.
[2006-10-12]
Kapitel 13 om hypotesprövning, dvs "statistisk bevisning".
Allmänt om begreppen nollhypotes, alternativhypotes, testvariabel
och kritiskt område. Detta illustrerades med exemplet test av
astrologer. Begreppen "fel av 1:a slaget" (α-felet) dvs att
förkasta H0 då H0 är sann samt
"fel av 2:a slaget"
dvs att inte förkasta H0 då H1 är
sann.
Begreppet styrkefunktion. Gav exemplet rattfylleri
som ytterligare illustration av dessa begrepp. Kopplingen med
konfidensintervall, den s k konfidensmetoden.
Inledning om χ2-test i form av test av given fördelning med illustration
från test av tärning.
Nästa gång behandlas homogenitetstest (kontingenstabeller) i form av ett exempel
om analys av skillnaden mellan nyfödda pojkar och flickor vad
gäller intresse
för ansikten. Se tabell 1 i bifogade vetenskapliga artikel Sex differences in human neonatal social perception. Dessutom behandlas enkel linjär regression (Kapitel 14).
Bilder
Ungefärligt innehåll.
[2006-10-09]
Fortsättning om kapitel 12 om konfidensintervall. Fallet ett normalfördelat
stickprov med okänd spridning gicks igenom vad gäller konfidensintervall för
väntevärde och standardavvikelse. Finns ett
allmänt
räkneschema
för att konstruera konfidensintervall.
Lite om enkelsidiga intervall
där man byter α/2 mot α i ena gränsen och låter den
andra gränsen vara
trivial.
Fallet två oberoende stickprov gicks igenom dels utan
några som helst fördelningsantaganden (utnyttjande CGS) samt
om man antar normalfördelning med kända standardavvikelser samt med
samma (men okända) spridning σ i
båda stickproven. Detta kontrasterades mot situationen "parvisa
observationer" där man bildar skillnader inom varje par och
analyserar dessa skillnader
som "ett stickprov".
Lite om t-fördelningen
och om hur man gör exakta konfidensintervall för
μ då data kommer från en N(μ,σ)-fördelning där
både
μ och σ är okända.
Se gärna följande godis om hur man beräknar
konfidensintervall med formelsamlingen
samt
en allmän
metod
att beräkna konfidensintervall.
Man kan även beräkna konfidensintervall för medianen
i en fördelning och
det går att ta fram exakta
konfindensintervall för parametrarna i
binomialfördelningen och
Poisson-fördelningen.
Bilder
Ungefärligt innehåll.
[2006-10-02]
Repeterade grundläggande begrepp vad gäller punktskattningar.
Lyfte fram det viktiga medelfelsbegreppet och i samband med detta den
ofta använda men något skumma metoden med "felfortplantning" (avsnitt 11.10) i läroboken
som i princip innebär en linearisering av skattningen.
Inledning om kapitel 12 om Intervallskattningen (eller konfidensintervall eller
osäkerhetsintervall). Ett enkelt exempel med normalfördelad skattning
med känd standardavvikelse.
Gick igenom den i praktiken mycket använda och
användbara "approximativa metoden" enligt formelsamlingen 12.3.
Där har man en skattning som
betraktas som approximativt normalfördelad och där man
skattar standardavvikelsen
med medelfelet. Konfidensintervallet (95%-igt) blir då
"skattning"±1.9600×"medelfel". Detta tillämpades
på en opinionsundersökning.
Bilder
Ungefärligt innehåll.
[2006-09-25]
Kapitel 11 om punktskattningar. Inledning med utgångspunkt i ett exempel om
opinionsundersökningar som introducerade begreppen parameter, punktskattning,
modell för data, stickprovsvariabel, väntevärdesriktighet, effektivitet och medelfel.
Satsen att om data är oberoende och likafördelade
så skattar aritmetiska medelvärdet väntevärdet
- väntevärdesriktigt
- konsistent
- det kan finnas effektivare skattningar
Ett exempel
på
att det kan finnas effektivare skattningar (alltså med mindre
varians) än
det aritmetiska medelvärdet.
Sats om skattning av standardavvikelse då data är
oberoende och likafördelade.
Maximum Likelihoodmetoden gicks igenom med ett exempel med
Poisson-fördelade
mätvärden. Idén bakom ML-metoden är att
använda som skattning
det värde på parametern som gör de erhållna
mätdata så sannolika som möjligt. Notera knepet att
logaritmera! Lite
slarvigt kan man säga att ML-skattningar är de bästa
tänkbara.
Minsta kvadratmetoden illustrerades med ett exempel om anpassning av
rät linje till tvådimensionella data (enkel linjär regression).
Bilder
Ungefärligt innehåll.
För den
intresserande ges här
en (något krävande) genomgång av teoretisk statistik
och teorin för "bästa tänkbara skattningar".
Det finns ett
annat angreppssätt på statistisk inferens nämligen Bayesiansk
statistik där man uttrycker sin osäkerhet om parametrars
värde som sannolikhetsfördelningar.
[2006-09-18]
Lite avslutning om kapitel 6 om normalfördelning samt lite avskräckande exempel
på vantolkning av CGS som t ex relativa betyg och intelligenskvot.
För den intresserade är här
lite material om bevis av CGS med hjälp av momentgenererande
funktion (Laplace-transform)
samt med hjälp av karaktäristisk
funktion, dvs Fourier-transformen
φX(t)=E(eitX).
Kapitel 7 om binomialfördelningen och deras släktingar, dvs diskreta
sannolikhetsmodeller.
Bland annat visades att summor av
oberoende Poisson är nya poissonfördelningar, och
approximationer fördelningarna emellan samt
normalapproximationer. Notera att vi kräver att ni lär er modellsituationerna
för för binomial, ffg och hypergeometrisk
fördelning.
Exempel:
Feluppskattning
för approximation av binomial- med Poisson-fördelning som
motiverar varför Poisson-fördelning är så vanlig
som modell för "sällsynta händelser".
En lustig och klassisk illustration om antalet ihjälsparkade
kavallerister. Det sista med
utgångspunkt från (den något förvirrade och
okunniga) boken "The
roots of coincidence" av Arthur Koestler.
För approximationer: se jämförelserna mellan Bin(25,0.2)-fördelning
och Po(5), Bin(50,0.1)-fördelning
och Po(5) samt mellan Bin(500,0.01)-fördelning
och Po(5).
Kapitel 8 om simulering ingår ej. Kapitel 9 läses kursivt.
Kapitel 10 läses också kursivt förutom avsnittet om
läges- och spridningsmått.
Inledning om det viktiga kapitel 11 om punktskattningar med
utgångspunkt i exemplet om opinionsundersökning beskrivet i
avsnitt 11.2 i läroboken.
Bilder
Ungefärligt innehåll.
[2006-09-14]
Lite mer om korrelationskoefficient och hur den kan vantolkas.
Kapitel 6 om den viktiga normalfördelningen.
med huvudresultatet att
linjärkombinationer av oberoende normalfördelade stokastiska
variabler är normalfördelad. Dessutom det viktiga resultatet
att om X är N(μ,σ) är (X-μ)/σ standardiserat
normalfördelad, dvs N(0,1), som innebär att alla
sannolikhetsberäkningar om allmän normalfördelning kan
återföras på en sannolikhetsberäkning med
N(0,1)-fördelningen.
Som varning: summan
av beroende normalfördelade
behöver inte vara normalfördelad ens när de är
okorrelerade.
Centrala gränsvärdessatsen som visar att (lite
slarvigt uttryckt) summan av "många", "ungefär" oberoende
och "ungefär" likafördelade är "ungefär"
normalfördelad. Detta har stora tillämpningar för
approximativa beräkningar och är dessutom viktigt för
att motivera att mätfel oftast antas vara normalfördelade.
Ett exempel på Centrala gränsvärdessatsen
är summan
av 100 tärningskast
samt hur man får fram fördelningen med hjälp av den s k
sannolikhetsgenererande
funktionen gX(t)=E(tX).
Bilder
Ungefärligt innehåll.
[2006-09-11]
Kapitel 5 om väntervärden. Lägesmått och spridningsmått. Räkneregler
för väntevärde och varians. Stora talens lag. Lite om beroendemått.
Bilder
Ungefärligt innehåll.
[2006-09-06]
Inlämningsuppgifterna delades ut.
Funktioner av stokastiska variabler (Avsnitt 3.10 i läroboken).
Kapitel 4 om fler-dimensionella stokastiska variabler med tyngdpunkt på fallet med
oberoende stokastiska variabler. Fördelningen för maximum och minimum av oberoende
stokastiska variabler.
Inledning om kapitel 5 om väntevärden och om tolkningar av väntevärden. Sats om hur E(g(X))
kan beräknas. Definition av spridningsmåttet varians.
Bilder
Ungefärligt innehåll.
[2006-09-04]
Kapitel 3 om stokastiska variabler. Enkla exempel med härledningar av
på diskreta stokastiska variabler, dvs sådana som kan anta ett ändligt (eller uppräkneligt oändligt) antal olika värden.
Kontinuerlig fördelning, dvs där sannolikhetsmassan fördelats på reella axeln med en sannolikhetstäthet.
Begreppet fördelningsfunktion och hur det kan användas för beräkning av sannolikheten att hamna i ett intervall.
Bilder
Ungefärligt innehåll.
Se gärna följande om uppkomstsätt för
för-första-gången-, binomial- och hypergeometrisk
fördelning.
[2006-09-01]
Urnmodeller vid dragning utan återläggning (avsnitt 2.5 a sid 24) samt vid
dragning med återläggning (avsnitt 2.5 b sid 25) som tillämpningar
på kombinatorik. Dyker upp senare i kapitel 7 som Hypergeometrisk fördelning
och binomialfördelning som har stora tillämpningar på bl a opinionsundersökningar.
Här
kan man läsa om det fjärde uteslutna fallet med dragning med
återläggning utan hänsyn till ordning.
Betingad sannolikhet (avsnitt 2.6) samt Lagen om total sannolikhet och Bayes' sats
med tillämpningar på bl a diagnostiska test.
Begreppet oberoende.
Ungefärligt innehåll.
Se gärna godiset : Monty Halls
problem (bilen och getterna) och Persi Diaconis videoföredrag
från Princeton
On coincidences. Här en nyhetsartikel om ett föredrag av Persi Diaconis
om slantsingling.
[2006-08-31]
Kapitel 2 i läroboken:
Grundläggande terminiologi: slumpförsök, utfallsrum, utfall,
händelser. Tolkningar av mängdoperationer som händelser. Kolmogorovs
axiom. Konstruktion av sannolikhetsmått för diskreta utfallsrum i
synnerhet likformig fördelning för ändliga utfallsrum. Lite om kombinatorik.
Bilder.
Ungefärligt innehåll.