Statistikk eller logikk eller hva jeg skal si
Trenger å sjekke tenkingen min her:
Det fantes en liste med 200 000 stort sett unike nummer. Et ukjent antall (ikke så stort) av disse var duplikater. Altså at person nr 1234 står to ganger på listen.
Man mottar et tilfeldig uttrekk av denne listen, 100 000 av numrene, og forventer at alle skal være unike, for det var egentlig meningen. Man kjører en duplikatsjekk og oppdager at noen av dem (ca. 100) ligger inne med mer enn en forekomst.
Spørsmål: Hvor mange av disse numrene er det sannsynlig at har (minst) en forekomst på hver av listene? Gitt at den originale listen på 200 000 ble delt tilfeldig i to? 100? 200?
Anta for enkelthets skyld at de fleste duplikatene er dobbelt opp, ikke flere enn det.
__________________
Feilen med verden er at de dumme er så skråsikre på alt - og de kloke så fulle av tvil. Bertrand Russel
|