Samenvatting

Data uit interne en externe bronnen importeren

RStudio maakt het eenvoudig om interne en externe data in te laden naar de R-sessie. Tegenwoordig zijn er steeds meer mogelijkheden om externe databronnen te ontsluiten. Zoals je hebt kunnen zien, biedt RStudio genoeg handvatten om deze bronnen te ontsluiten. Daarbij zijn er ook verschillende functies en packages om data in te laden. In Case 2 van dit boek, wordt bijvoorbeeld gebruik gemaakt van het jsonlite package om externe JSON-data te ontsluiten.

Externe data en JSON Websites bieden door middel van API's (Application Program Interfaces) de mogelijkheid om hun data te gebruiken. Deze data wordt meestal als JSON formaat geïnstalleerd JSON staat voor Javascript Object Notation en is opgebouwd uit Javascript objecten. Dit zijn key - value paren. In R wordt JSON gezien als een lijst (list) object. Het daarna eenvoudig om het om te zetten en te gebruiken in de R-sessie, net als in Case 2 te zien is.

Specificeren hoe de data geïmporteerd moet worden

Een belangrijk onderdeel van data importeren in een R-sessie, is specificeren op welke manier de data ingeladen moet worden. Belangrijke punten hierbij zijn bijvoorbeeld aangeven wat de decimalen zijn, of de eerste rij van de dataset de kolomnamen zijn en wat de scheidingstekens zijn. De makkelijkste manier om data te importeren met RStudio is de Import Dataset functie gebruiken. RStudio heeft de goede eigenschap dat het voor het grootste deel al de juiste instellingen voor jou selecteert. Echter moet je er altijd zelf goed naar kijken of het echt de manier is hoe jij data wilt importeren.

Data exporteren

In sommige situaties wil je de data exporteren buiten de R-sessie. Dit kan zijn omdat R een tussenstap is voor databewerking of verrijking of omdat je met dezelfde dataset in een ander systeem verder wilt gaan. R biedt genoeg mogelijkheden om dit te doen. Een data frame of matrix exporteren is daarbij zeer eenvoudig. Ook hierbij kun je specificeren hoe de data geëxporteerd wordt. Je hierbij bijvoorbeeld ook aangeven of de tabel rij- of kolomnamen heeft, wat het scheidingsteken moet zijn en welke extensie de dataset moet hebben (.xls, .csv, .txt etc.).

results matching ""

    No results matching ""