Kennisportal
Kennisportal is een kennisplatform met een focus op de brede doelgroep Business en IT.

Fast and Furious: Big Data Analytics Meets Hadoop

Relaties vinden met Hadoop en Analytics

Vandaag de dag heeft een tablet zo’n 8 GB intern geheugen, genoeg om wel 80 apps, 10 films, 800 liedjes of 6000 boeken op te slaan. Schaal deze capaciteit op met meer dan duizend  en je benadert het kleinste Hadoop-cluster.

Wat is Hadoop?
Hadoop is een open-source software-omgeving van The Apache Software Foundation waarmee applicaties Petabytes aan ongestructureerde data in een cloudomgeving op commodity hardware kunnen verwerken. Doordat het systeem is gebaseerd op Google's MapReduce en Google File System (GFS), kunnen grote datasets in kleinere datablokken worden opgedeeld zodat een cluster deze parallel kan verwerken. Hadoop werkt met een gedistribueerd bestandssysteem (HDFS) wat maakt dat data op meerdere nodes kunnen staan en geaggregeerd met een hoge bandbreedte door een cluster behandeld kunnen worden. En dit tegenopmerkelijk lage kosten, waardoor het een effectieve aanvulling is op een traditionele data infrastructuur. Doordat Hadoop zeer grote volumes aankan, is het ideaal om te gebruiken voor snel groeiende datastromen uit bijvoorbeeld transactiesystemen, sensoren of social media. Dankzij de inzet van analytics kan deze data vervolgens worden gebruikt om verder te onderzoeken  en interessante  relaties in te ontdekken.

Download de whitepaper
Wilt u meer te weten komen over Hadoop? Download geheel vrijblijvend de volledige whitepaper ‘Big data analytics meets Hadoop’.

 

Download de whitepaper
Download