• Helene van Ettinger-Veenstra

Advanced Analytics del 3: vilka svar kan en Machine Learning-modell ge mig?

Artificiell Intelligens kan definieras som datorer som ska uppnå mänskligt beteende genom att uppvisa intelligens. Intelligensnivån är beroende av de modeller som datorn ges att använda och prestanda på modellerna är beroende av datakvalitén, som diskuterades i förra blogginlägget. I Business Intelligence-världen kan vi använda Machine Learning-modeller som har en specifik typ av Artificiell Intelligens, nämligen att kunna förse saker med etiketter. Vilken data som helst kan få en etikett med rätt modell; en bild, en grupp människor eller produkter, en tidsstämplad rad i en tabell eller en enskild produkt. Bara så länge det finns tillräckligt med exempel för varje etikett.


Från detta följer logiskt att om en Machine Learning-modell ska kunna gynna verksamheten så måste den resulterande etiketten vara användbar. Därför diskuterar vi med kunden innan ett projekt påbörjas hur problemställningen och önskad form på resultatet ska hänga ihop. Eftersom våra kunder är intresserade av implementering blir detta mer påtagligt med ett exempel. Låt oss skapa ett exempelföretag inom online retail.


Vi kallar vårt exempelföretag för Explore Nature och de specialiserar sig på outdoorkläder. Vi följer Explore Natures väg från problemet till möjliga (användbara!) svar från en Machine Learning-modell.


Explore Nature upplever problem med returbeteende hos kunder. Detta är vanligt i retail-världen, och det finns många olika Machine Learning-modeller för att titta närmare på returer eller returbeteende. De vill veta om de kan minska sin inkomstförlust från returnerade varor. Med tanke på att en Machine Learning-modell är något av en intelligent etikettskrivare, så kan vi tänka oss att följande möjliga frågor som input leder till etiketter:


  1. Blir denna vara eller order returnerad? Svar: ja/nej, eller t.ex. 70% sannolikhet att den blir returnerad.

  2. Är kunder som returnerar lika varandra? Svar: det finns så här många olika kundgrupper, och kund X faller i grupp Y.

  3. Är varor som returneras lika varandra? Svar: denna vara faller i den här varugruppen.


Svaret från modellen är dock inte nödvändigtvis slutpunkten. Att identifiera i vilken kundgrupp en kund med många returer eller en som returnerar enbart dyra varor faller ger möjlighet att förstå kunden och dess beteendemönster. För kunder inom retail så kan etikettskrivarens output, kombinerad med en identifiering av vilka faktorer som bidrar mest till modellen, resultera i nedanstående ’Personas’-bild.

Fyra olika 'Personas' som representerar fyra kundgrupper i retail. Dessa kundgrupper kan resulteras från en Machine Learning Klustringsmodell

Personas är ett sätt att beskriva de olika kundtyperna, i detta fall baserat på hur snabbt de handlar, var och hur de handlar, samt effekt av rabatt, konkurrens och marknadsföring. Denna information kan användas till riktad marknadsföring av vårt företag Explore Nature; de kan skicka mer information till The Researcher, extra rabattkoder till The Discount seeker, och early bird-erbjudanden till The Impatient.



Explore Nature hade dock inte som mål att förbättra marknadsföringen i första hand, utan ville minska kostnaden för returer. Om Explore Nature nu har upptäckt att deras kundgrupper The Impatient och The Discount seeker står för störst andel returer, så har de anledning att välja att tillämpa olika strategier för att försöka ändra på dessa kundgruppers returbeteenden. Explore Nature väljer att erbjuda en ökad rabatt-trappa för trogna Discount seeker-kunder, som belöning för att inte returnera varor i tidigare ordrar. Till trogna The Impatient-kunder väljer de i stället att erbjuda 24-timmars öppet köp.


”Vilken åtgärd leder till färre returer?” är Explore Natures andra del av frågeställningen. Denna fråga kan inte besvaras av den intelligenta etikettskrivaren som svarade på ”Är kunder som returnerar lika varandra?”. Således kräver den nya frågan en ny analys. Explore Nature kan välja till exempel att noggrant övervaka ändringar i deras befintliga Business Intelligence-rapporter, eller att utföra ett A/B-test på mindre grupper för att testa och optimera de nya returminskningsstrategierna.


”Men nu faller vi tillbaka på mänsklig intelligens för att tänka ut lämpliga strategier,” säger Explore Nature till vår Data Scientist, ”kan vi inte använda Artificiell Intelligens i stället?”. Och absolut kan vi det! Vi är inte ute efter att ersätta de metoder som ger önskat resultat (läs: rätt svar på de frågor vi ställer) med Machine Learning, utan att kunna ställa andra typer av frågor som leder till nya insikter eller förbättrade resultat. Tänk om Explore Nature väljer inte att tillämpa belöningar för att ändra returbeteenden, men att de väljer att ändra kundens kunskap om varor i stället, och på så sätt förbättrar köpbeteenden och får nöjdare kunder. De kan då satsa på ett rekommendationssystem i webshopen, som tar hänsyn till kundens outdoorbeteende och önskad passform. Detta skulle motsvara en etikettskrivare som svarar på frågan ”passar denna vara den här kunden?”. Explore Nature kan också välja att implementera ett flaggningssystem för potentiella returer i deras webshop, som kan identifiera om en vara i en kundvagn har stor chans att bli returnerad.


I början skrev jag att vi diskuterar med våra kunder innan ett projekt påbörjas hur problemställningen och önskat resultat kan hänga ihop. Det är tydligt från exemplet att förståelse för företagets egentliga behov påverkar arbetssättet avsevärt. Vi behöver mänsklig intelligens som har kunskap om mål och visioner för att kunna ta fram en bra artificiell, intelligent etikettskrivare. Vill företaget ha insikt i sina kunders beteenden eller egentligen ändra på dessa beteenden? Och vilken typ av åtgärd passar företaget? De olika frågorna kräver olika utvecklingsmetoder av Machine Learning-modellen, med olika algoritmer eller baserat på olika datakällor. Vi hjälper er att hitta rätt typ av lösning som passar er data, era behov och era visioner.


Skriven av: Helene van Ettinger-Veenstra

Helene är en Data Scientist och Business Intelligence konsult med en forskningsbakgrund och utbildning i statistik och machine learning. Helene har erfarenhet av komplex data-analys och multidisciplinärt projektarbete.