Saknad data - Överlevnadsbias
En av de svåraste utmaningar vi kan ställas inför är saknad data. Det är lätt att glömma att vi ibland av naturliga skäl inte kan samla in information om alla händelser som sker eller skulle ha skett.
En klassisk berättelse återger en situation från andra världskriget. De allierades flygplansutvecklare analyserade de flygplan som återvände från stridsuppdrag för att se var de oftast blev träffade. Tanken var att förstärka med kraftigare skydd där det behövdes.
En ungersk matematiker, Abraham Wald, ifrågasatte dock arbetssättet - de hade bara information om plan som faktiskt återvänt - data för plan som skjutits ner ingick inte i sammanställningen. Kanske var det på de platser där de återvändande planen saknade träffar som var det största problemet?

Motsvarande problem uppstår även i affärsvärlden. En produkt som sålt dåligt kanske vi inte ska fortsätta med? Eller har den sålt dåligt för att den var populär, tog slut i lager och den inte gick att sälja mer? Vi vet inte hur många som hade köpt produkten OM vi hade haft den i lager. Inom e-handel måste vi ofta ta med information om hur många som sökt på produkten och generellt inom handel kan vi se hur snabbt en produkt sålt slut.
Undersöker man hur framgångsrika företag är finns risken att vi utgår från de bolag som finns idag och missar de företag som gått under. Analysera löpande vilket data du har med i ditt urval och vad det representerar.
I vår utbildning inom data literacy går vi igenom olika fallgropar och problemområden med mätningar. Hör av er till oss så kan vi diskutera hur en sådan utbildning skulle kunna se ut för er.

Skriven av: Morgan Kejerhag
Morgan Kejerhag har arbetat med Qlik-plattformen sedan 2005 och är en av Sveriges mest erfarna konsulter. Under åren har Morgan arbetat med flertalet multinationella bolag där han lett arbetet i att bygga upp stora Qlik-miljöer såväl som små kunder. LinkedIn Kontaktuppgifter