Big Data kan både være ‘Dirty’ og ‘Creepy’

Peter Ottesen,
Adm. dir. Mediabroker

Big Data er et stort emne på SXSW-konferencen i Austin. Især diskussionen om ’privacy’ fylder meget. Marketingmæssigt skal mange firmaer balancere mellem smart og skræmmende, skriver Peter Ottesen hjem fra konferencen.

Begrebet Big Data går igen ved rigtig mange foredrag på SXSW-konferencen i Austin. Peter Ottesen, adm.dir. i mediabureauet Mediabroker, har sendt dette indlæg hjem, der bl.a. handler om, at data ikke blot kan være ’big’, men også både ’dirty’ og ’creepy’.

”Begrebet Big Data går igen ved rigtig mange foredrag på SXSW. Ingen tvivl om at vi står i en tid hvor vi vil opleve en eksplosion i datamængderne. Mange nye teknologier vil komme til at producere rigtig store datamængder.

SXSW har flere kloge hoveders bud på, hvordan vi løser udfordringerne. Jeg har samlet tre p-ord som gennemgående temaer på tværs af mange foredrag: Predictive analytics, Personalization og Privacy.

Predictive analytics handler om at omforme data til handling – ofte real time. Til det formål bruges primært algoritmer. Udfordringen for mange algoritmer er, at med store datamængder kommer også store mængder ’Dirty Data’ – dvs. data der ikke er relevant – og som ofte er umulige at sortere fra.

En professorgruppe fra University of Texas fortalte, at man havde arbejdet på en algoritme, der kunne forudsige HIV udbrud. Udfordringen var at de første symptomer på HIV lignede traditionel forkølelse. Deres bud var, at algoritmer er udfordret på store datamængder, for det medfører samtidig mere ikke-relevant data.

Det handler derfor om i større grad at kunne nedbryde datamængderne i mere ’spiselige’ klumper. Deres og andres bud er at bruge avanceret 3D visualisering af store datamængder for at løse udfordringen med ikke-relevant data.

Personliggørelse er at forbedre brugerens oplevelse baseret på den data, vi efterlader. Der er bare en uhyre svær balancegang mellem smart/relevant og skræmmende/irrelevant (smart vs. creepy).

Et ekspertpanel fra IBM talte om at bruge data når forbrugeren havde brug for at vide noget. De gav eksemplet med den intelligente paraply. Paraplyen finder ud af hvor den befinder sig og kombinerer det med vejrudsigten – og så blinker den når der er brug for den, ret smart hvis man er på vej ud af døren. De kaldte det for push relevancy.

Med personliggørelse følger naturligt nok Privacy overvejelser. Og privacy diskussioner fylder rigtig meget på SXSW. Især marketingmæssigt skal mange firmaer balancere mellem smart og skræmmende.

Et ret ekstremt eksempel kom fra en privacy aktivist. Mange har nok hørt historien om kæden Target, der forudsagde en piges graviditet, som hende far reagerede på – for han var sikker på, at hun ikke var gravid. Hvorefter han fandt ud af hun faktisk var gravid.

Eksemplet ligner dette – bare med modsat fortegn: Et par ønskede ikke, at der var nogen, der digitalt vidste, at de var gravide, så de ville ikke have digitale spor. Så ingen Facebook-beskeder, alle deres venner blev underrettet mundtligt. Ingen relaterede Google søgninger og kreditkortet blev udskiftet med ’tank op kredit kort, som er anonyme osv. De endte med en adfærd, der til fulde lignede en kriminel, der ville slette sine spor.

Et andet stort diskussionspunkt omkring privacy vedrører wearables, som også har et stort fokus her på SXSW.

Wearables kan f.eks. overvåge kropsfunktioner eller aktiviteter, som brugeren laver. Mulighederne i teknologien er enorme, og er vel kun i sin spæde opstart endnu. Et konkret eksempel, jeg hørte var den personlige seng, der tilpasser sig dit søvnmønster.

Personlige sensorer kommer til at skabe mange terrabytes af data på personniveau. 1 terrabyte svarer angiveligt til den information, der kan stå på papiret fra ca. 50.000 træer!

Men hvem skal have adgang til at kunne bruge, og eje de personlige data, som wearables kommer til at skabe?

Skal vi selv eje den – og så kan vi eventuelt donere vores data til videnskaben – lige som vi donerer organer. Eller skal videnskaben/medicinalindustrien have adgang, for så kan de meget lettere bekæmpe sygdomme. Der er ikke nogen enkle svar og i de fleste lande halter lovgivning langt efter teknologien.

Big Data er bare Big. Og det kræver nye analyseteknologier, at skulle omforme det til indsigt.”