Big en Little Data: 9 verschillende soorten data en hun toepassing

Geen reacties
Tags: , , , , , ,
Posted 19 mrt 2014 in nieuws

De hoeveelheid aan beschikbare data is overweldigend en maakt het moeilijk voor marketeers en adverteerders om zakelijke keuzes te maken. Er zijn verschillende soorten data met elk hun eigen toepassing en doeleinden. Little Data, het kleine broertje van Big Data, bestaande uit kleine hoeveelheden gegevens die correct zijn verkregen en geanalyseerd, kan juist zorgen voor betere marketing tegen lagere kosten.

Big Data als nieuwe trend
Als trend krijgt Big Data momentum nu partijen vanuit alle mogelijke invalshoeken er gebruik van maken. Met als drie veelvoorkomende uitgangspunten: meer data is altijd beter dan minder data, de snelheid, volume en variëteit van data zorgen voor nieuwe bronnen van potentiële kennis en voorkennis, en met Big Data kunnen alle vragen worden beantwoord. Maar geeft Big Data wel een nauwkeurig beeld van de toekomst? In hoeverre moet je alles meten om een significante uitspraak te kunnen doen? En wat kun je eigenlijk met sociale media data?

Big Data is historisch
Big Data is grotendeels historische data, of ‘tracking data’, zoals financiële gegevens, verkoopcijfers, klantengedrag, weersinformatie en voorraadinformatie. Bijna alle data kijkt terug, ongeacht hoe actueel or hoe direct beschikbaar de data mag zijn. We kunnen trends zien in de data die ons een vermoeden geven van de nabije toekomst, en we kunnen achterhalen wat de achterliggende reden kan zijn voor het succes van een bedrijf, maar de meeste historische data is van beperkte waarde voor het voorspellen van de toekomst.

Betrouwbare data
We hebben vaak de neiging om alle data gelijk te behandelen, maar dat is zelden zo. De zakelijke wereld wordt 24 uur per dag overspoeld met data vanuit alle richtingen en het wordt alsmaar meer. Die toenemende stroom van data is een deel van het probleem: meer verwarring en welke informatie is correct en kun je vertrouwen? Marketingprofs dook in de data en somde op volgorde van meest betrouwbaar tot minst betrouwbaar, negen verschillende soorten data en hun toepassing:

1 . Experimentele data
De meest betrouwbare data: experimenten worden zorgvuldig ontworpen en gecontroleerd, en worden uitgevoerd door objectieve derden die experts zijn in dergelijke experimenten. Met nulmeetingen en controlemeetingen en geavanceerde statische analyses wordt het kaf van het koren gescheiden.

2 . Onderzoeksdata
Wetenschappelijke onderzoekstudies uitgevoerd door ervaren professionals die objectieve betrouwbare data leveren. Vaak hebben de studies een experimenteel karakter. De onderzoeksopzet, normatieve data, wiskundige modellering, stimuluscontrolemechanismen, statistische controles, historische ervaring en kwaliteitsborging normen zorgen voor zeer nauwkeurige gegevens met minimale ruis.

3 . Marketingmix datamodel
De oprichting van een analytische database, waarbij de data geschoond en genormaliseerd wordt en het gebruik van multivariatie statistieken en modellering waarmee een deel van de ruis wordt geïsoleerd en geneutraliseerd: dit alles zorgt ervoor dat je betere data krijgt dan met de werkelijke verkoopcijfers. Het is beter meetbaar, betrouwbaarder en het kan inzicht geven in die variabelen die zorgen voor de groei en omzet (komt dat bijvoorbeeld uit het mediabudget, uit het aantal verkopers of de gebruikte prijsdifferentiatie?). Het kost meestal wel meerdere jaren van gegevens verzamelen en verwerken om de maximale waarde te verkrijgen.

4 . Media-mix datamodel
Hetzelfde concept als data modelleren uit de marketingmix, alleen toegepast op een andere set variabelen. Dezelfde algemene regels zijn van toepassing: een analytische database, dataschoning, modelling en statistieken, waardoor de ruis in de data wordt geminimaliseerd en effecten van verschillende media beter kan worden bepaald. In combinatie met gecontroleerde experimenten zijn de data en analyses zelfverklarend.

5 . Verkoopcijfers
Verkoopcijfers geven een redelijk goede maar geen perfecte maatstaf van de daadwerkelijke verkoop. Deze cijfers zijn namelijk geen betrouwbare en valide metingen van reclame-effectiviteit, optimale mediabestedingen, productkwaliteit en concurrerende activiteiten. Verkoopcijfers zijn beperkt te vertrouwen. De economie, concurrenten, het weer, de inflatie, de vakanties, nieuwsgebeurtenissen, politieke gebeurtenissen, afwijkingen in voorraden en distributie of prijsveranderingen, zorgen voor valse echo’s en vervormde illusies. Verkoopcijfers geven een slecht beeld van oorzaak en gevolg. Je kan redelijk goed zien wat er is gebeurd, maar niet waarom en welke oorzaken het lieten gebeuren.

6 . Eyetracking data
Met geleidelijke verbeteringen in de meetapparatuur en software kan met hoge nauwkeurigheid worden bepaald waarop het menselijk oog is gericht. Hiermee verkrijg je bruikbare diagnostische informatie dat helpt begrijpen waarom een ​​pakket, website of advertentie niet de aandacht te trekken of bepaalde berichten of afbeeldingen niet worden gezien.

7 . Biometrische of fysiologische metingen
Huidreacties, dilatatie van de pupillen, hartslag , EEG ( hersengolf) metingen, emotieherkenning, et cetera zijn zeer interessant en spannend, maar voor nu zijn deze mogelijkheden nog grotendeels speculatief en onbewezen. Sommige meetinstrumenten zijn redelijk goed in het registreren van opwinding, maar zonder toevoeging van een enquête of kwalitatief onderzoek is er geen nauwkeurige manier om te weten of de opwinding positief of negatief is.

8 . Gemeenschappen of adviespanels
Veel grotere bedrijven hebben geïnvesteerd in systemen waarmee ze regelmatig enquêtes unnen houden onder en communiceren met een kleine doelgroep consumenten. Enquêtes worden uitgevoerd door verschillende mensen in het bedrijf op een dagelijkse of wekelijkse basis. De kosten per onderzoek of meting zijn relatief laag, als je de kwaliteit van de resultaten niet in aanmerking neemt. Dergelijke gemeenschappen zijn niet echt representatief, niet willekeurig gekozen en zelden ooit gevalideerd. Na verloop van tijd wordt de representativiteit van de gemeenschap ondermijnd door de risico’s van conditionering en het aanleren van gewenst gedrag.

9 . Sociale Media Data
Sociale media data is momenteel erg populair: de gegevens zijn relatief goedkoop, vaak in groot volume en real time (van dag tot dag, van uur tot uur). Veel nieuwe software tools en systemen maken interessante analyses van de gegevens relatief eenvoudig. Als vroegtijdig waarschuwingssysteem is sociale media data het meest waardevol voor als er iets fout gaat, een concurrerend initiatief wordt gestart of er onverwachte afwijkingen optreden.

Sociale media data moet echter altijd met de nodige argwaan en scepticisme worden bekeken:

  • Veel productcategorieën en merknamen worden zelden genoemd op sociale media, waardoor de steekproef te klein is om betrouwbare data te genereren.
  • Sociale media worden beïnvloed door nieuws, evenementen, advertenties, promoties, publiciteit, films, concurrenten en televisieshows. Hierdoor krijg je veel ruis in de data.
  • Sociale media data zijn makkelijk te manipuleren. Een belangrijke trend in je data kan gemakkelijk een list van je concurrent zijn geweest om je te verwarren.
  • Bedrijven en organisaties streven er naar om sociale media content te creëren en uitingen te beheren, waardoor de waarde van de gegevens snel verdwijnt.
  • Aangezien sociale media uitingen worden geïdentificeerd en verzameld met scraping, weten we nooit de exacte bron, de context, de stimulus of de onderliggende geschiedenis van een uiting. Deze onbekende factoren maken interpretatie riskant.

Little Data
Zakelijke beslissers zijn vaak beter gediend als ze kunnen vertrouwen op beproefde en echte instrumenten en systemen. Met willekeurige steekproeven kun je het gedrag of de stemming van een hele groep meten door met een kleine doelgroep te praten. Een steekproef van 1500 is voldoende om de verkiezingen te voorspellen. Een steekproef van 200 tot 300 is voldoende om te voorspellen hoe de bevolking zal reageren op een nieuw product of dienst. Een steekproef van 200 gebruikers kan een nieuwe smaak pindakaas binnen een week testen, en op die manier kan nauwkeurig worden bepaald hoe het product wordt ontvangen en wat de marktwaarde zal zijn na introductie.

Onderzoeken zijn relatief goedkoop en heel accuraat, omdat professionele onderzoekers de bron, stimulus, context en geschiedenis kennen, en werken met geteste meetinstrumenten, normatieve data en kwaliteitscontroles. Marketingonderzoek kan zo worden ontworpen om juist voorspellend te zijn en vooruit te kijken, in plaats van terug te kijken. Alternatieve scenario’s kunnen worden getest en verkoopcijfers binnen nauwe marges worden voorspeld. Productformules kunnen worden geoptimaliseerd, en nieuwe commercials op hun effectiviteit worden getest voordat ze live gaan.

Al dit soort onderzoek is gebaseerd op Little Data: data wordt verzameld met steekproefcontroles, nauwkeurig gecontroleerde experimenten of wetenschappelijke onderzoeken. De steekproef en de steekproeffout zijn bekend, net als de stimulus, de vragen, de context en de betekenis van de antwoorden.

Ondanks de huidige hype rondom Big Data blijft dus de vraag: wat moet je weten om goede zakelijke beslissingen te kunnen nemen en hoe verkrijg je die informatie?



Lees het volledige bericht op Emerce »


Add Your Comment