Mønstergjenkjenning – en hjørnestein i informasjonsstyrte bedrifter
Av professor Ole-Christoffer Granmo
Dette er del 2 av en miniserie. Se del 1 her.
Viktige forretningshendelser – kanskje et forestående tap av en verdifull kunde – kan ofte oppdages i forkant av hendelsen. Men da må man kjenne til tegnene som varsler om hendelsen. Det kan være så enkelt som å følge med på kundedata og oppdage en fallende trend.
Viktige forretningshendelser – kanskje et forestående tap av en verdifull kunde – kan ofte oppdages i forkant av hendelsen. Men da må man kjenne til tegnene som varsler om hendelsen. Det kan være så enkelt som å følge med på kundedata og oppdage en fallende trend.
Mønstergjenkjenning
er en teknikk som kan brukes til å lete gjennom store mengder data etter
bestemte mønstre – regelmessigheter i dataene som er forårsaket av bakenforliggende
hendelser. For en virksomhet kan mønstre av interesse være kjennetegnene på de gode
markedsføringstiltakene, de verdifulle kundene som går tapt, salgsmuligheter eller flaskehalser i en
forretningsprosess. Gjennom å oppdage slike hendelser, før de finner sted, kan
man forbedre markedsføringen, forsterke kundeforbindelsene, øke salget og
redusere flaskehalsene som begrenser bedriften. Det dreier seg om prediktiv
analyse.
I Conduct tar
vi utgangspunkt i en beste praksis arkitektur for mønstergjenkjenning når vi
jobber for å gi bedrifter et fortrinn gjennom bruk av datamining og prediktiv
analyse.
•
Dataseleksjon
– valg og
sammenstilling av informasjonselementer.
•
Preprosessering – utfylling av manglende verdier,
glatting av støyfulle data, identifikasjon og håndtering av ekstremverdier og
feilaktige verdier, håndtering av inkonsistens, semantikk.
•
Transformering
– egenskapsuttrekking,
normalisering, utledning og avledning av nye variable.
•
Analyse – gjenkjenning av scenarier, avviksdeteksjon,
aggregere og gi statistiske mål, tidsserieanalyse, forløpsanalyse, etc.
•
Rapportering
– tabeller, figurer,
kart, etc.
Som indikert medfører hver byggestein en rekke valg – hvilken kombinasjon
av teknikker er for eksempel best egnet
for gjenkjenning av mulig kundefrafall? Fornuftige valg her er
avgjørende både med tanke på analysenøyaktighet og skalerbarhet.
I systemarkitekturen skissert over ser vi et mønstergjenkjenningssystem
for analyse av logger. Ved hjelp av et scenariobibliotek, samt innsamlet
loggstatistikk og modeller, kjenner systemet igjen scenariene i biblioteket
etter hvert som de forekommer i loggene. Her er det også mulig å utvide med
avviksdeteksjon hvor man detekterer avvik fra normal adferd, i tillegg til selve
scenariene. Nye typer avvik kan da danne grunnlag for utvidelse av scenariobiblioteket.
Det er også viktig å velge en egnet infrastruktur for implementasjon av
mønstergjenkjenningssystemet. Vi har positiv erfaring med Open Source-teknologi
for Big Data Analytics, både når det gjelder skalerbarhet og når det gjelder
fleksibilitet. Vi vil i den sammenheng trekke frem noen egenskaper vi ser på
som viktige:
·
Skalerbarhet – lagring, søk, og analyse av
vilkårlig store datamengder gjennom såkalt ”Auto-Sharding” og ”MapReduce”.
·
Verktøykasse – systemet bygges opp gjennom
utvikling av en kraftig og gjenbrukbare verktøykasse med moduler for lagring,
søk, analyse og rapportering.
·
Gjennomsiktighet
– fullt innsyn og
påvirkningsmulighet i alle stadiene av analysen sikrer kvalitet og pålitelighet.
En egnet datavarehusløsning med Big Data Analytics-utvidelser vil kunne
realisere disse egenskapene.
Conduct
jobber for å realisere verdien som ligger i åpne og innovative IT-løsninger. Vi
har omfattende kompetanse innen analyse av data, både strukturerte data i
overkommelige mengder og Big Data. Conduct har medarbeidere med doktorgrad i
prediktiv analyse og datamining med ekspertise innenfor analyse og prediksjon,
overvåkning og styring, optimering og ressursallokering, data- og tekstmining,
visualisering, simulering og beslutningsstøtte, samt smarte applikasjoner. La
oss hjelpe deg å utnytte dine data for å optimere driften av din virksomhet.
Ingen kommentarer:
Legg inn en kommentar