Geen big data

Dit boek behandeld niet het onderwerp Big Data. Dit is data die te groot is om door een enkele CPU op je machine bewerkt te kunnen worden. Hiervoor heb je geavanceerde software nodig om meerdere computers aan elkaar te koppelen voor meer rekenkracht. Bekende software-omgevingen die dit doen zijn bijvoorbeeld Apache Hadoop en Apache Spark. Tegenwoordig ook verschillende Microsoft-producten zoals Microsoft R server of Microsoft Azure Batch Services. Het leuke aan deze software is dat je er R in kunt programmeren. Hierdoor wordt het mogelijk om R-bewerkingen te doen op gigantische datasets, datasets met tientallen of zelfs honderden miljoenen aan rijen aan data. Als je R onder de knie hebt, kun je altijd naar de websites gaan die deze Big Data oplossingen aanbieden. Je zult de R code herkennen en daardoor de stap kunnen maken naar Big Data.

In het artikel Microsoft Azure Batch: Doorlooptijden terugbrengen van dagen naar uren. leg ik uit hoe Microsoft Azure Batch Services in zijn werk gaat en het kunt gebruiken om meer rekenkracht te hebben voor R-calculaties.

results matching ""

    No results matching ""