Big Data

Recent heb ik een aantal tweets de wereld in gestuurd rond Big Data. Is dit het nieuwe  buzzword in IT of zit er wat meer achter dan buzz?

Zoals in vele branches valt er veel uit te leggen aan de hand van auto’s of andere verstaanbare technologie. Big Data valt ook uit te leggen aan de hand van een aantal voorbeelden die we vandaag in het ons dagelijks leven wel tegenkomen.

Wat had je gedacht van Facebook…

We hebben allemaal wel al eens geklikt op een link waarvan Facebook zei “Deze kan je misschien ook leuk vinden?”

Dit is een voorbeeld van hoe Big Data in de praktijk werkt. Door het klikken op deze link heeft Facebook zijn adverteerder opnieuw een extra persoon om de marketing van een bepaald product op los te laten.

Hoe gaat dit in de praktijk in zijn werk?

Aan de hand van de data die je bij de initiele  sign-up ingeeft bij Facebook begint er achterliggend al het één en ander te werken.

Achterliggend worden er een aantal links gelegd met data die al in het systeem van Facebook zit.

Ik geef een voorbeeld. Je woont bijvoorbeeld in Antwerpen, je bent een man, niet gehuwd, 20-jaar. Dan zal het systeem achter Facebook gaan kijken naar achterliggende data van mannen in de buurt van Antwerpen die niet gehuwd zijn en in de categorie 20-25 jaar zitten. Aan de hand hiervan zullen er een aantal plaatsen, producten, naaar voor geschoven worden die je misschien leuk kan vinden.

Eens je een eerste vriend hebt gemaakt op Facebook gaat er opnieuw een molentje draaien. Want wie ken je nog? Facebook begint voorstellen te doen. Nog een persoon die je misschien kent…? En op dezelfde manier zal Facebook alsmaar meer info over je krijgen en op die manier alsmaar gerichter dingen gaan voorstellen.

Nu hoe krijg je al die verschillende datasets onder controle? Wel door het principe van Big Data via software zoals Hadoop en een bovenliggende laag die dit kan gaan interpreteren. Zoals bijvoorbeeld PDW van Microsoft of Cloudera.

Op deze manier kan de achterliggende data mooi ingedeeld worden en kunnen er links gelegd worden waar je alleen nog maar hebt van kunnen dromen…

Persoonlijk is dit iets wat voor mij bedrijven van klein tot groot kan gaan helpen.  Iedereen wil graag zijn data omzetten in iets wat voor hen strategisch belangrijk kan zijn. Het kan belangrijk zijn om je audit team fraude op te laten sporen, het kan belangrijk zijn om je Marketing team zeer gericht marketing te laten doen, Het kan interessant zijn om je webshop automatisch voorstellen te laten doen aan je klanten. Het interpreteren van data kan op het eind van de rit $$ betekenen en dat is toch waar alle bedrijven voor willen gaan?

Hieronder nog een YouTube filmpje van de CIO van Cloudera die het voor jullie allemaal nog is eens op een rijtje zet….

2 thoughts on “Big Data

  1. Big Data houdt ook in “hoe doorzoek je zulke datasets” ? Vergeet Control + F al maar 🙂 de key is meta data die op op tiered storage zit en liefst zo snel mogelijk – SSD / Flash …

    Tweede probleem: backups? 10GB ok. 100GB ok. 1TB ok. maar 10TB of 100TB of nog meer, dat past niet meer in backup windows en klanten willen 100% data availability.

    Interesting times ahead 🙂

    1. Doorzoeken kan via Cloudera of PDW van Microsoft.Onderliggend filesysteem kan bijvoorbeeld Hadoop zijn.
      Back-up kan opnieuw naar disk of naar gelang datagroei kan ook de software meegroeien. Talk to Dell bij interesse hé 🙂

Leave a Reply