Käisin 21. novembril Tallinna Õismäe Gümnaasiumi reaal- ja loodusainete nädalal rääkimas 9.-12. klassi õpilastele andmeanalüüsist. Ettekande käigus tegin väikese eksperimendi, mille eesmärk oli vaadata, kui hästi suudavad õpilased juhuslikke numbreid valida. Mõte selleks tekkis twitteri postitusest: Asking 100 people for a random number from 1 to 10.
Selleks, et andmeid koguda, ehitasin ühe lihtsa shiny äpi, milles iga kuulaja sai telefonis valida juhuslikke numbreid vahemikust 1-10.
Kokku valis numbreid 130 õpilast. Aktiivsemad nendest klikkisid 20-30 numbril ning passiivsemad 2-3. Eksperimendi tulemustest selgus, et juhuslikke numbreid ei suuda inimesed kuigi hästi valida. Selgelt domineerivad “juhuslikus valimis” numbrid 6, 7 ja 8. Väga vähe on aga valitud numbrit 1. Mingil põhjusel ei tundunud see õpilastele piisavalt juhuslik. Väga sarnased olid tulemused ka inspiratsiooniks olnud twitteri postituses.
Kuna valitud numbrite arv oli vastajate hulgas väga erinev, siis proovisin järgmisel graafikul vähendada kõige aktiivsemate õpilaste mõju lõpptulemustele. Selleks jätsin valikusse alles vastajad, kes olid valinud vähemalt 3 numbrit ning igaühe kohta valisin kuus korda välja kolm juhuslikku numbrit. Üldjoontes on jaotus sarnane esimese pildiga. Peamine erinevus on selles, et ka number 5 liikus populaarsemate juhuslike numbrite hulka.
Kuidas?
Andmete kogumist kirjeldasin juba eelnevalt. Kogu skript (koos shiny äpiga) on leitav Githubist: https://github.com/toomase/random_number.