Staafdiagrammen en histogrammen
Met R kun je ook staafdiagrammen en histogrammen maken. Deze visualisaties zijn handig als je de hoogtes en aantallen van bepaalde categorieën wilt visualiseren. Om dit te demonstreren, maken we handmatig een data frame aan met een aantal categorieën en waarden zodat we deze in de grafiek kunnen visualiseren.
Een staafdiagram maken met de barplot()
functie
De barplot()
functie werkt op een vergelijkbare manier als de plot
functie. Echter werken de parameters iets anders.
Om de parameters van een functie te bekijken, kun je de
help()
functie gebruiken.
Als we een enkel argument geven aan de barplot()
functie, de data die we willen visualiseren, geeft het een standaard opmaak van het staafdiagram.
# Een staafdiagram maken met de prijzen van Diesel
barplot(Diesel)
Zoals je kunt zien, wordt op volgorde van jaar de hoogte van de dieselprijzen weergegeven.
Extra parameters voor het staafdiagram
We gaan het staafdiagram verbeteren door er een aantal parameters aan toe te voegen:
barplot(Diesel, width = 3,
space = 0,
names.arg = Jaar , horiz = TRUE, col = "red",
main = "Ontwikkeling Dieselprijzen",
xlab = "Prijs in euro's", ylab = "Jaar")
Zoals je kunt zien, kun je door het gebruik van een aantal parameters de standaardopmaak van R opleuken.
Voor een overzicht van de beschikbare kleuren in R, kun je de colors()
functie gebruiken voor een overzicht.
# De eerste 7 beschikbare kleuren in R weergeven
head(colors())
## [1] "white" "aliceblue" "antiquewhite" "antiquewhite1"
## [5] "antiquewhite2" "antiquewhite3"
Een histogram maken met de hist()
functie
Met een histogram wordt de frequentie van een bepaalde waarde gevisualiseerd. Vooral in de statistiek wereld is het een handige visualisatie om de verdeling van de waarden weer te geven. Met de hist()
functie kun je in R een histogram visualiseren.
hist(Diesel)
In het histogram is o.a. af te lezen dat een prijs onder de 0.8
2 keer voor komt. Ook kun je aflezen dat een prijs tussen 1 en 1.1
, (tussen de euro en 1.10 euro) 4 keer voor komt.
Als we een grovere verdeling willen maken, kunnen we een extra parameter toevoegen aan de hist
functie. We gebruiken hier het breaks
argument voor.
hist(Diesel, breaks = 2)
In de histogram is goed af te lezen dat prijzen onder de één euro 5 keer voor komen en boven de één euro 9 keer voor komen.