Big Data = Hadopp = Falskt

Share on FacebookShare on Google+Email this to someoneTweet about this on TwitterShare on LinkedIn

Jag har nu tillbringat ett par månader med att missionera runt NoSQL och des förträfflighet och många gånger hamnar jag i Big Data området.

Det som ofta händer då är att personerna i mötet, för det är oftast i mötesform, säger ”Big Data?” ”Men det är ju Hadoop och det har vi redan börjat titta på”.

Pratar jag med olika konsultleverantörer så är ofta reaktionen det samma. Om man är aktiv inom Big Data så handlar det till 99% alltid om att man försöker göra saker med Hadoop.

Nu säger jag inte att Hadoop inte är Big Data, utan att det är inte bara Hadoop som är Big Data.

För en Big Data platform behöver olika komponenter, Hadoop är en oslagbar kostnadseffektiv intelligent plattform för lagring av olika typer av data i stora mängder men den är inte vidare interaktiv. Med det menar jag att du behöver programmera eller installera/sätta upp ett antal komponenter innan du kan interagera på ett enkelt sätt med ditt data.

För innan du kastar dig in huvudstupa in i Hadoop träsket så kanske du skall först fråga dig vad du skulle vilja göra med datat först och om du inte vet det så kanske du skall använda dig av en lösning som ger dig möjlighet att söka och kombinera data utan en massa utveckling först.

För var vill du helst lägga ner din tid?

En massa tid för att sätta upp miljön, massa programmering för ladda data och söka efter information. Och varje gång du vill se något nytt måste programmering till.

Eller

Fokusera på att söka och analysera data i och med att så fort data läses in så är det tillgängligt och sökbart.

Det är därför NoSQL och MarkLogic är en självklar del av en Big Data plattform.

Och du, du behöver inte välja antigen eller. Åtminstone MarkLogic kan dra nytta av en existerande Hadoop implementation.

/Mats Stellwall

Share on FacebookShare on Google+Email this to someoneTweet about this on TwitterShare on LinkedIn