Datadrevet reinkarnation
Et af mine små hobbyprojekter i 2024 har været at lege med data fra Wikipedia på forskellige måder, særligt det bagvedlæggende datasæt i https://wikidata.org, der kan downloades og bruges til alt muligt.
Det er et dejligt stort datasæt med 114 mio entries, og herunder ca 3 mio mennesker, hvoraf ca 2 mio har information om fødsels- og dødsdatoer.
Lidt basal dataanalyse af alder viser at der nok er lidt støj i sættet, men trods alt en stigende alder over tid. Og hvis man ender i wikidata som person er der en god chance for at man enten er noget særligt eller at man er blevet skovlet ind i datasættet som en del af en import af fx en biografisk eller genealogisk database.
Tid til genfødsler
Hvad er så mere naturligt end skrive noget kode, der kan finde alle de historiske personer, som kunne være en tidligere inkarnation af mig?
Ved at tygge sig igennem og koble døds- og fødselsdatoer sammen i en graf-datastruktur, får man en fint netværk af personer, der kunne være tidligere inkarnationer af hinanden.
Her er en visualisering af 52.548 personer, der kunne være tidligere inkarnationer af mig, forbundet med en linje pr sjæle-hop.
Og finder man de længste kæder i netværket, ender man med at overveje om man engang var Roger de Felbrigge?
Jeg har generet en rapport med alle mine ti længste her: Lineage for Christian Dalager.
Nej, jeg har ikke webificeret det, da det ærligt talt er lidt meget energi at bruge på noget, jeg ikke tror på, men jeg har dog smidt projektet på GitHub. Så kan de tekniske typer finde sig selv, eller gøre det til noget mere smart: https://github.com/dalager/wikidata-incarnations :)
- Previous: Distraktionsfælder
- Next: Ragged Books