ai-algorithms

Hur fungerar AI-algoritmer?

Alla pratar numera om AI, och det är inte annorlunda inom marknadsföring. Allt fler programvaror för marknadsföring använder artificiell intelligens för att vässa resultaten.

Detta blogginlägg ger en grundläggande översikt kring vad som verkligen driver AI-baserad marknadsföring och marketing automation med prediktiva algoritmer och maskininlärning.

Informationen i det här blogginlägget är inte nödvändigt för att använda AI i din marknadsföring, men den ger ytterligare förståelse.

Kunskap är sällan en börda.

En introduktion till AI-algoritmer

När vi pratar om AI menar vi för det mesta inte verklig artificiell intelligens som vi ser i filmerna. I de flesta fall menar vi maskininlärning, eller kanske prediktiv analys.

I huvudsak är detta bara en smart användning av statistiska modeller. Artificiell intelligens är uppdelad i två kategorier: ”Svag” eller ”smal” AI och ”stark” eller ”generell” AI.

  • Svag AI refererar i allmänhet till en maskininlärningslösning som är dedicerad till en viss uppgift, till exempel att optimera priset på en produkt eller välja den bästa sändtiden för ett epostmeddelande. Det här är inte riktigt intelligens, bara statistiska algoritmer som kan anpassa sitt beteende när datat de tränats på förändras.
  •  Generell AI är å andra sidan ett flexibelt system som kan tänka och resonera självt, och lösa problem det inte har blivit utbildat på att göra i förväg. Kanske kan de bli medvetna om sin egen existens någon gång i framtiden, precis som en människa.

Det finns bara svag AI idag, och allt som diskuteras här ligger på den sidan av gränslinjen.

Det betyder inte att dessa system är mindre effektiva på att utföra sina uppgifter. Tvärtom kan de vara otroligt imponerande. Men du behöver inte oroa dig för att AI-baserade marknadsföringssystem tar över världen – åtminstone inte än på några år.

Du behöver inte oroa dig för att AI-baserade marknadsföringssystem tar över världen – åtminstone inte än på några år.

Men även svag AI kan orsaka problem, till exempel påverka utgången i val, som vi lärde oss genom skandalen av Cambridge Analytica och dess roll i det amerikanska presidentvalet 2016.

I resten av detta blogginlägg kommer vi bara att titta på svaga AI-lösningar som erbjuder självlärande algoritmer för att lösa specifika problem för vilka de har utvecklats.

Jag använder också termen ”AI” och ”maskininlärning” för samma sak, även om många anser att det är en alltför grov generalisering.

ai-algorithms

Viktiga termer inom AI

Låt oss göra en snabb överflygning och se vad AI är och hur det fungerar innan vi kommer till huvudämnet. Vissa läsare vet redan detta men det är bäst att stå på fast mark innan vi går in i mer detalj. Det här avsnittet ger ett helikopterperspektiv.

Tre huvudteknologier har tillsammans möjliggjort det som i folkmun kallas för artificiell intelligens:

  • Big-data och data-mining
  • Prediktiv analys
  • Maskininlärning

Men vad är det?

big-data

Big-Data, Prediktiv analys och maskininlärning

Big data innebär insamling och analys av stora mängder information – ibland miljardtals datapunkter. När det undersöks med hjälp av data-mining algoritmer kan vi detektera nästan osynliga trender och korrelationer.

Vi kan till exempel upptäcka mönster i historiskt data som korrelerar till att vissa typer av kreditkortstransaktioner är bedrägeri.

Big data innebär insamling och analys av stora mängder information – ibland miljardtals datapunkter

Prediktiv analys handlar om att utveckla algoritmer som kan upptäcka dessa mönster i framtida okänt data. Till exempel, för att upptäcka om en nu pågående kreditkortstransaktion innehåller sådana mönster och sedan avgöra om transaktionen sannolikt är bedräglig.

Prediktiv analys handlar om att utveckla algoritmer som kan upptäcka dessa mönster i framtida okänt data.

Maskininlärning avser prediktiva algoritmer som kan anpassa sig till förändrade förhållanden. Dessa mjukvarulösningar tränar om sig själva och lär sig göra ännu bättre förutsägelser i framtiden.

I själva verket blir de självoptimerande eller självlärande. Prediktiva system kan bara upptäcka anomalier baserat på de mönster som de ursprungligen tränades på. Om något förändras i sin miljö kan de inte anpassa sig.

Med maskininlärning tränas systemet kontinuerligt om för att göra olika förutsägelser när nytt data blir tillgängligt utifrån de senaste typerna av kreditkortsbedrägeri från den verkliga världen.

Med maskininlärning tränas systemet kontinuerligt om

Se det så här: Med maskininlärning baseras programvarubeteendet på historiskt data. Denna process kallas att ”träna” systemet. Om nytt data blir tillgänglig senare kan vi träna om systemet så att det anpassar sitt beteende till förändrade förhållanden – dvs nya datamönster.

När ett prediktivt system tränas om ofta (eller till och med kontinuerligt), fortsätter det att anpassa sina förutsägelser för att reflektera förändringar i omvärlden.

ai-algorithm-learn

Olika typer av AI algoritmer

Prediktiva maskininlärningsalgoritmer klassificeras vanligtvis baserat på hur de lär sig. De tre huvudtyperna av lärande kallas för supervised, unsupervised och reinforcement learning. Vad är skillnaden?

  • Supervised learning: Algoritmerna är tränade på att utföra en viss uppgift med historiska data.
  • Unsupervised learning: Insikter hittas ur historiskt data, även om vi inte vet exakt vad vi letar efter.
  • Reinforcement learning: Algoritmerna tränas genom positiva eller negativa erfarenheter, dvs ”trial and error”.

På samma sätt klassificeras AI-algoritmer ofta efter vad de gör:

  • Klassificeringsalgoritmer förutspår en av flera möjligheter, t.ex. för att bestämma om en kund sannolikt kommer att köpa en specifik produkt eller inte.
  • Regressionalgoritmer förutspår ett numeriskt värde, t.ex. för att bestämma det bästa priset på en produkt.
  • Klusteralgoritmer förutspår grupplikhet, t.ex. att hitta segment av dina kunder och kunder med liknande attribut.

ai-algorithms-3

Olika algoritmer

Det finns ett stort antal olika algoritmer, alla lämpade för olika typer av problem. Efterföljande blogginlägg kommer inte att beskriva dem alla, men de nämner några och förklarar vad de gör.

Dessa algoritmer kommer alltså att beskrivas i detalj i separata blogginlägg:

Här följer en populärvetenskaplig förklaring av datavetenskap.

data-science

Datavetenskap

Inom datavetenskap finnas det ett överväldigande antal tekniska termer. Vissa är svåra att förstå, även för analytiker! De flesta är emellertid lätt förstådda efter att vissa grundläggande begrepp har förklarats.

Dataanalys är att studera hur variabler är relaterade till varandra och hur deras relationer kan utnyttjas för att göra förutsägelser

Det grundläggande fokuset för all dataanalys är att studera hur variabler är relaterade till varandra och hur deras förhållande kan utnyttjas för att göra förutsägelser. Låt oss börja från början:

  • Vad är en variabel?
  • Vad betyder det att två variabler har en relation?
  • Vad är en observation i datavetenskap?

Innan vi dyker in i mer dataorienterade termer kan vi betrakta termen ”observation”. När vi samlar in data för analys i marknadsföring observerar vi oftast hur våra (potentiella) kunder beter sig.

ai-observation

Observationer

Vi strukturerar vårt insamlade data så att informationen om en kund har sin egen rad i en tabell, där egenskaperna (eller attributen) finns i olika kolumner. Eftersom varje rad i vårt data innehåller information om en enda observerad kund kallas varje rad för en observation.

För att uttrycka det lite kortfattat kan vi säga att en observerad kund är lika med en observation. Föreställ dig ett Excel-ark med rader och kolumner för att få en känsla av hur det här organiseras.

ai-variable

Variabler

En variabel innehåller information om ett attribut av alla observationer (kunder) som studeras, organiserat som en kolumn i tabellen. Om vi vill studera hur snabbt en sportbil kan köra runt ett varv på racingbanan samlar vi in data om många olika bilar som kör på den banan, eller kanske till och med data om bilar på andra liknande banor.

Eftersom alla sportbilar inte är exakt identiska, kan vi inte bara mäta den tid det tar för en bil att köra slingan. Vi vill också samla in data om vilken typ av däck bilarna använde, vilken typ av motor de har, osv.

Dessa värden är attribut som hör till varje enskild bil, och för våra ändamål är de variablerna vi använder när vi försöker förutspå hur lång tid det tar en bil att köra ett varv runt banan.

ai-relationship

Relationer

En relation mellan variabler är hur de är associerade med varandra. En sportbils tid runt banan kommer till exempel att vara beroende på vilken motor den har. Det betyder att det finns en relation mellan tiden som krävs för att köra runt banan och motorvariabeln.

När vi analyserar relationen mellan variabler strävar vi efter att skapa modeller baserade på data som vi samlat in. Vi använder dessa modeller för att förklara förhållandet mellan variablerna mer detaljerat. Enkelt uttryckt är en modell en sammanfattning av hur variabler påverkar ett resultat.

Enkelt uttryckt är en modell som en sammanfattning av hur variabler påverkar ett resultat.

Tänk på en kopplingstavla för barn, där de kan dra streck mellan punkter på rittavlan.

Varje punkt är en variabel, och linjerna barn drar mellan dem är relationerna. Modellen är då den form som börjar dyka upp på kopplingstavlan. Allteftersom fler punkter kopplas ihop blir det tydligare vad bilden föreställer och ju lättare kan vi förutsäga vad ritningen representerar.

Modellen ändras om punkterna är närmare eller längre ifrån varandra, eller grupperas på olika sätt. Att förstå relationen mellan variabler (punkterna) hjälper oss då att förklara dem eller förutse vad som händer härnäst.

Självklart är detta en förenkling och verklig modellering är mycket mer komplex.

Modeller kan anta många former och kan användas för att förutsäga ett resultat eller för att ge sammanhang och förståelse av datat. När en modell görs klassificeras de ingående variabler som antingen beroende eller oberoende.

ai-dependent-variable

Beroende och oberoende variabler

Dessa termer används oftast inom statistik, men du kan höra andra termer som används för samma begrepp. Till exempel kallar vi dem ofta för utdatavariabler och indatavariabler inom maskininlärning.

Låt oss titta på vad några av dessa betyder.

Som termerna antyder är en beroende variabel på ett eller annat sätt knutet till någon annan variabel. Detta innebär att de ändras om en eller flera andra variabler ändras. Ta till exempel omsättning, som är beroende av antalet sålda enheter och varje enhets pris.

Motsatsen till beroende är oberoende. Precis som det låter är en oberoende variabel inte knuten till andra variabler.

Ändringar i en oberoende variabel kan utlösa en ändring i en beroende variabel, men det omvända gäller inte. Ett exempel: om rynkor i ansiktet är beroende på tid som passerar, är tiden den oberoende variabeln som kan användas för att förklara rynkor.

Ändringar i en oberoende variabel kan utlösa en ändring i en beroende variabel, men det omvända gäller inte

Dock kommer tiden inte sluta gå bara för att du inte får rynkor. Därför kan en beroende (eller utdata) variabel förklaras eller förutses med en uppsättning oberoende (eller indata) variabler. Vilka variabler som klassificeras som beroende eller oberoende bestäms utifrån de antaganden som användes för att skapa modellen.

ai-outlier

Outliers

En annan vanlig term i datavetenskapens värld är ”outlier”, vilket är en extrem observation.

Om du gör ett hole-in-one när du spelar golf, speglar det nog inte hur du spelar normalt. Därför är ett hole-in-one en outlier mot de andra normala resultaten.

Vi kanske inte vill ta hänsyn till den här poängen när vi försöker förutse vilken poäng du troligen kommer att få när du spelar golf nästa gång, eftersom det skulle göra att förutsägelsen blir mer positiv än vad som normalt kan förväntas, och därför göra förutsägelsen mindre korrekt.

På samma sätt vill du antagligen inte inkludera outliers när du studerar försäljningsstatistik. Om en nyhetsartikel skriver om en av dina produkter, vilket resulterar i en stor men tillfällig försäljningsökning, bör det behandlas som en anomali snarare än vad som normalt skulle förväntas under andra år.

ai-overfitting

Overfitting

Den sista viktiga termen att förstå är ’overfitting’. Detta definieras som en analys som stämmer för väl med det data den tränats på, och att undvika detta är en av de svåraste och mest avgörande sakerna i maskininlärning.

Varför skulle det vara dåligt att en modell passar data för nära?

Problemet är att när en modell skapas för att förklara data tränas den med en vald uppsättning datapunkter. Om modellen passar det för nära är det osannolikt att det också fungerar när en ny, större uppsättning data med andra mönster introduceras.

Fel i våra förutsägelser reduceras genom att använda en mer komplex modell (en som kan beskriva fler aspekter av relationerna mellan variabler), men allteftersom komplexiteten ökar riskerar modellen att bli mindre och mindre generell. Detta kan leda till förutsägelser baserade på nya observationer som är felaktiga.

Du behöver inte veta alla detaljer för att använda AI i din marknadsföring eller marketing automation, men en översiktlig kunskap är aldrig fel.

Marketing automation blir alltmer AI-baserad, och arbetsuppgifterna för marknadschefer och digitala marknadsförare blir mycket mer datadrivna. Marknadsföringsavdelningar behöver helt nya färdigheter, bland annat kunskaper om avancerad marketing automation, AI och datavetenskap.

Specifika algoritmer

I dessa blogginlägg förklaras följande algoritmer på en populärvetenskaplig nivå: