Big Data is al een aantal jaren in opkomst. Toch zijn het vooral early adopters en grote multinationals die het gebruiken. Experts verwachten dat het niet lang meer duurt voordat Big Data echt mainstream wordt. Laten we eens wat dingen op een rijtje zetten!

Wat is Big Data eigenlijk?

Ik heb de term ‘Big Data’ al vaak genoeg gehoord, maar weet eigenlijk niet precies wat het is. Daarom leek het me handig om kort uit te leggen wat het inhoudt, zodat we in ieder geval zeker weten dat we over hetzelfde praten.

Laten we beginnen op Wikipedia: “Men spreekt van big data wanneer men werkt met een of meer datasets die te groot zijn om met reguliere databasemanagementsystemen onderhouden te worden”. Blijkbaar verzamelen we zo veel data, dat er een aparte term bedacht moest worden voor het verwerken ervan. Hoe dat komt? Simpel: digitalisering en technologische vooruitgang.

Elke keer dat je online gaat, iets koopt op het internet of je smartphone met GPS gebruikt, ‘maak’ je data.  Maar denk ook aan de slimme meter in je meterkast, of deze slimme koelkastmagneet. En wat dacht je van zelfrijdende auto’s? Het duurt niet lang meer voordat ze in Nederland rondrijden en continu data over hun omgeving verzamelen en naar de fabrikant sturen.

Het gebruik van Big Data

Dus we creëren met z’n alleen steeds meer data. Met platforms als Hadoop van Apache is het voor grote bedrijven ook geen probleem meer om die data te analyseren. Maar wat kun je eigenlijk met Big Data?

Volgens Bernard Marr, schrijver van het boek ‘Big Data in Practice’, kun je denken aan de volgende toepassingen:

  • Het genezen en voorkomen van ziektes: met Big Data kunnen enorme aantallen medische gegevens doorgespit worden. Zo ontdek je patronen en kunnen ziektes in een eerder stadium ontdekt worden. Ook helpt het bij de ontwikkeling van nieuwe medicijnen.
  • Honger uit de wereld helpen: Big Data kan in de landbouw gebruikt worden om de opbrengsten van gewassen te vergroten en de uitstoot van milieu-onvriendelijke stoffen te minimaliseren. Ook kan het gebruik van machines verder geoptimaliseerd worden.
  • Verre planten onderzoeken: NASA gebruikt Big Data om miljoenen datapunten te analyseren voor toekomstige missies naar Mars en andere planeten.

NASA gebruikt Big Data om missies naar Mars te plannen

Geen misselijke toepassingen, als je het mij vraagt! Er zijn gelukkig ook kleinschaligere toepassingen voor Big Data.

Een mooi voorbeeld is dat van een dierentuin in Washington in de Verenigde Staten. Door het wisselvallige weer in de staat, was het moeilijk om de bezoekersaantallen nauwkeurig te voorspellen. De dierentuin wilde dit probleem aanpakken, om zo te bepalen hoeveel personeel er op een willekeurige dag ingezet moest worden.

Met Big Data werd de informatie over bezoekers uit het verleden afgezet tegen gedetailleerde weersinformatie uit dezelfde periode, om zo bezoekersaantallen te voorspellen en de hoeveelheid personeel daarop aan te passen. Ook ontdekten ze dat veel mensen ‘s avonds laat of ‘s ochtends vroeg hun online tickets kochten, waarop ze hun online kortingsacties aanpasten en er in de afgelopen 2 jaar 771% meer online tickets verkocht werden.

Big Data in de cloud

Naast het gebruik van Big Data, neemt ook het gebruik van de cloud steeds verder toe. Deze 2 ontwikkelingen blijken hand in hand te gaan, juist voor kleinere bedrijven. Hoe zit dat?

Je kunt je voorstellen dat het analyseren van enorme hoeveelheden data ook heel veel computerkracht vraagt. Servers zijn soms wel uren aan het rekenen voordat ze resultaten produceren. Voor grote bedrijven met eigen servers of datacenters is het dus makkelijker om met Big Data aan de slag te gaan dan voor kleinere bedrijven. Niet elk bedrijf kan of wil investeren in dure hardware voor de servers die ze nodig hebben om hun data door te lichten.

Matt Wood, de ‘data science chief’ van Amazon Web Services, beweert dat een flexibele infrastructuur het belangrijkste onderdeel van je Big Data-oplossing is. Hij waarschuwt ervoor dat Big Data verslavend kan werken, omdat je afhankelijkheden ontdekt die je nog nooit eerder hebt gezien. Des te belangrijker is het volgens hem om in de cloud te werken, zodat je je ‘verslaving’ kan botvieren zonder dat je hoeft te investeren in een eigen serverpark.

Magazijn met archiefmappen, big data uit het verleden

Big Data draait allemaal om het snel in kunnen spelen op vragen en problemen die zich aandienen, en ik hoef je niet te vertellen dat de aanschaf van dure hard- en software voor servers bij de meeste bedrijven vaak een lang traject is. Voordat je het weet is je probleem al niet relevant meer. Met een flexibele cloudoplossing heb je altijd de benodigde rekenkracht achter de hand, en kun je eenvoudig uitbreiden.

Klaar voor de mainstream

Big Data kan voor veel bedrijven een interessante bijdrage leveren. Meestal is er meer data beschikbaar dan je denkt, en kun je daar met Big Data en slimme analisten hele belangrijke conclusies uit trekken. Nu de technieken ook voor kleinere bedrijven steeds toegankelijker worden en cloudoplossingen zich keer op keer bewijzen als betrouwbare basis, lijkt het een kwestie van tijd voordat Big Data mainstream is.

Maar of dat dit jaar al gebeurt? Misschien moeten we maar eens wat data gaan verzamelen en het gaan analyseren in de cloud, zodat we dat nauwkeurig kunnen voorspellen ;)…