HISPARC NAHSA Tellen van Random gebeurtenissen Indeling • normaalverdeling • Inleiding kansrekening • Kansrekening bij detectie van kosmische stralen
Jan 02, 2016
HISPARC NAHSA
Tellen van Random gebeurtenissen
Indeling
• normaalverdeling
•Inleiding kansrekening
•Kansrekening bij detectie van kosmische stralen
HISPARC NAHSA
Tellen van Random gebeurtenissen
Je hebt gemerkt dat gemeten waarden nogal eens fluctueren
• Geiger-Müller tellers tikken onregelmatig als je ze bij een bron
houdt
•De aantallen die je meet bij een enkele HISPARC-detector
HISPARC NAHSA
Tellen van Random gebeurtenissen
Kosmische straling vormt een constante achtergrond die de aarde
gelijkmatig treft vanuit alle richtingen
Gemeten waarden zijn NIET echt CONSTANT
Lange termijn gemiddelden geven de werkelijkheid redelijk goed weer
HISPARC NAHSA
Tellen van Random gebeurtenissen
Uit metingen BLIJKT dat de gemeten waarde afhangt van:
•Tijdstip van de dag
•Hemelrichting
•Weersomstandigheden
Al deze invloeden kun je meten. Je kunt er zelfs correcties voor bepalen.
Maar: je meting zal meestal niet het echte
gemiddelde opleveren!
Gelukkig kom je met goede metingen dichtbij het echte gemiddelde.
HISPARC NAHSA
Tellen van Random gebeurtenissen
Je zet een experiment op om een bepaald verschijnsel te onderzoeken
…en je laat het experiment een bepaalde tijd lopen.…
Maar je meet niets: Je telt NUL tikken.
Wat betekent dat?
Stel dat je in een meting van een uur één treffer (=gebeurtenis) waarneemt
Kun je dan concluderen dat dit verschijnseleen tempo heeft van een 1/uur?
Inleiding
HISPARC NAHSA
Tellen van Random gebeurtenissen
Eerst even afspreken:Random gebeurtenissen:
•zijn onafhankelijk van elkaar•worden niet beïnvloed door voorgaande gebeurtenissen•zijn niet te voorspellen
0 sec tijd
Als het aantal treffers op 1 uitkomt kan dit het resultaat zijn van het toevallig vastleggen van een zeldzaam optredend verschijnsel dat beter weer-gegeven kan worden door een veel lager tempo
(~0?).Of de looptijd van de meting kan de gebeurtenis net gemist hebben(net te laat gestart of te vroeg beëindigd).
HISPARC NAHSA
Tellen van Random gebeurtenissen
Een meting van 1 zou in werkelijkheid een gemiddelde kunnen zijn
van 0 of misschien zelfs
2?
1 ± 1Een meting van 2
2 ± 1? ± 2?Een meting van 37
37 ± minstens een paar?
Een meting van 1000
1000 ± ?
HISPARC NAHSA
Tellen van Random gebeurtenissen
Dit histogram laat, minuut na minuut,
2-voudige coincidencies zien tussen 2 gestapelde CROP detectoren
2-voudige coïncidenties
Gemeten per minuut
Gedurende 2 uur
HISPARC NAHSA
Tellen van Random gebeurtenissen
De meeste metingen liggen dichtbij het gemiddelde van 609.5 tikken/minuut
Merk op dat de 0 “onderdrukt” is! (de vertikale as begint bij 500, niet bij 0)
500
In werkelijkheid zijn dit lichte fluctuatiesrondom een gemiddelde van ruim 600.
Laagste waarde 562
562
657
Hoogste waarde 657
2-voudige coïncidenties
Gemeten per minuut
Gedurende 2 uur
HISPARC NAHSA
Tellen van Random gebeurtenissen
Geen plotselinge pieken van 800; geen terugval tot 400.
Zijn dit goede data? Hoe kunnen we vaststellen of dit goede metingen
zijn of dat de verschillen te groot zijn?
2-voudige coïncidenties
Gemeten per minuut
Gedurende 2 uur
HISPARC NAHSA
Tellen van Random gebeurtenissen
De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere
meting verwijderd is van het gemiddelde .
Als alle metingen identiek waren,dan was het gemiddelde duidelijk
en zou de standaarddeviatie simpelweg 0 zijn.
Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel
de standaarddeviatie )
HISPARC NAHSA
Tellen van Random gebeurtenissen
De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere
meting verwijderd is van het gemiddelde .
Als alle metingen identiek waren,dan was het gemiddelde duidelijk
en zou de standaarddeviatie simpelweg 0 zijn. 0
Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel
de standaarddeviatie )
HISPARC NAHSA
Tellen van Random gebeurtenissen
Mijn hartslag bij het ontbijt gedurende 100 dagen61 64 67 70 70 71 75 72 72 69 68 70 65 67 62 59 62 66 66 6868 73 71 72 73 71 71 68 69 68 69 65 63 70 70 76 71 72 74 6056 74 75 79 72 72 69 68 68 68 62 66 66 66 61 77 75 74 63 7263 62 65 65 66 65 67 67 65 67 68 62 67 60 68 65 70 70 69 7068 73 64 71 71 68 70 69 73 72 70 69 67 64 67 58 66 69 76 73
Height in Inches for a Sample of 100 Adult Males
0
2
4
6
8
10
12
14
40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100
Frequentietabel van de verdeling van de hartslag
56 157 058 159 160 261 262 563 364 365 766 767 868 1269 870 1071 772 873 574 375 376 277 178 079 1
Hartslag gedurende 100 dagen
HISPARC NAHSA
Tellen van Random gebeurtenissen
Height in Inches for a Sample of 100 Adult Males
0
2
4
6
8
10
12
14
40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100
Spreiding = xmax-xmin = 23
gemiddelde= =67.20
Modus = 68 (=meest voorkomend)
Mediaan = 68.52 (=middelste waarneming)
N
xxxx
N
xN
N
i i 3211
Hartslag gedurende 100 dagen
HISPARC NAHSA
Tellen van Random gebeurtenissen
Het gemiddelde alleenlaat ons niet zien
hoe dicht op elkaargepakt de data zijn.
De spreiding kan misleidend zijnals de metingen buitensporige
gegevens bevatten:
HISPARC NAHSA
Tellen van Random gebeurtenissen
HISPARC NAHSA
Tellen van Random gebeurtenissen
gemiddelde,
beschrijft de spreiding in de metingen op een andere manier: door een berekening van hoe groot de gemiddelde afstand van een meetpunt is tot het gemiddelde
(xi – )2
N
= i=1
N
σ
HISPARC NAHSA
Tellen van Random gebeurtenissen
Height in Inches for a Sample of 100 Adult Males
0
2
4
6
8
10
12
14
40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100
Spreiding = xmax-xmin = 23
gemiddelde = =67.20
standaardafwijking = 4.357=
N
xxxx
N
xN
N
i i 3211
(xi – )2
N
Hartslag gedurende 100 dagen
HISPARC NAHSA
Tellen van Random gebeurtenissen
De nieuwe lijnen geven de afstand aan van een en twee keer de standaarddeviatie onder en
boven het gemiddelde
Voor deze gegevens gaf Excel een SD van 20. Dus staan de lijnen op:
609.5 ± 20.0 = 589.5 and 609.5 ± 40.0 = 569.5 629.5 649.5
2-voudige coïncidenties
Gemeten per minuut
Gedurende 2 uur
HISPARC NAHSA
Tellen van Random gebeurtenissen
Een gering aantal (hier 5) ligt op meer dan 2 SD van het gemiddelde.
De meeste meetwaarden blijken binnen±1 SD van het gemiddelde te liggen.
Een paar meetwaarden vallen binnen 1 à 2 SD.
de SD beschrijft hoe dicht op elkaar gepakt de meetwaarden rond het gemiddelde zijn, en
geeft een grens aan over hoe ver ze mogen spreiden.
Hier zijn er geen meetpunten op meer dan 3 SD.
2-voudige coïncidenties
Gemeten per minuut
Gedurende 2 uur
HISPARC NAHSA
Tellen van Random gebeurtenissen
*Verticale lijnen op ±1, 2, 3 SD van het gemiddelde. *Je ziet dat de meeste metingen binnen ±1 SD van het gemiddelde liggen. *Heel af en toe worden er metingen gevonden met >3 SD van het gemiddelde.
frequentie, opgenomen in intervallen van een minuut gedurende een periode van 1 week (zelfde opstelling)
•Metingen gegroepeerd rondom het gemiddelde(615). •Nul onderdrukt; weinig data onder 550 (of boven 680).
Frequentieverdeling van 2-voudige coïncidenties
Tempo (aantallen per minuut)
HISPARC NAHSA
Tellen van Random gebeurtenissen
Gausskromme:
HISPARC NAHSA
Tellen van Random gebeurtenissen
Met andere woorden:
68% van de metingen valt binnen ±1 SD van het gemiddelde.
95% van de metingen binnen ±2 SD
99.7% van de metingen binnen ±3 SD
Karakteristiek voor deze vorm: het stuk tussen
µ en µ+ bevat 68%
Van het totale oppervlak onder de curve.
HISPARC NAHSA
Tellen van Random gebeurtenissen
Je ziet dus dat een goede meting wel erg dicht bij de echte waarde kan zitten maar
nooit helemaal perfect zal zijn. (Zelfs als dat zo is weten we dat niet met zekerheid.)
Daarom geven we in de kansrekening een verschil aan tussen de echte waarden en de
gemeten waarden.
We hebben nu een aardig idee over hoe metingen verspreid kunnen liggen rondom een gemiddelde.
Omgekeerd kunnen we ook zeggen:
Als we een meting doen dan zal deze in 68% van de gevallen op minder dan een SD van het gemiddelde af liggen.
Maar we weten nog steeds niet nauwkeurig hoe groot dit gemiddelde werkelijk is!
HISPARC NAHSA
Tellen van Random gebeurtenissen
Voorbeeld:het aantal jongeren in Nijmegen van 12 tot 18 jaar is 14.987.
*Gemiddelde lengte = 1.680 m (=µ)
*Gem. afwijking: 5,3 cm (= )
Steekproef: alle leerlingen van onze school: (1412)
Gemiddelde 1.685 m (= x)Gem. afw: 6,1 cm (=SD)
Je snapt dat hoe groter de steekproef is hoe beter je bij het echte gemiddelde uitkomt.
HISPARC NAHSA
Tellen van Random gebeurtenissen
Deze voorgaande beschrijving gaat op voor alle onafhankelijke gebeurtenissen. Dit zijn zowel allerlei soorten metingen als spellen met een dobbelsteen.
Bij een grafische voorstelling van de uitkomsten ontstaat dan de bekende Gausskromme.
Soms is het gemiddelde () niet eens bekend, zoals bij onze opstelling voor het meten van kosmische straling. Toch kun je dan met een beperkt aantal metingen een redelijke schatting maken van wat het gemiddelde moet zijn en hoe groot de spreiding daarin is.
Het zal je nu wel duidelijk zijn dat één meting geen bruikbaar gemiddelde oplevert.
Terug naar Indeling