Samenvatting
Correlaties
Correlaties geven een mate van samenhang weer. Deze samenhang kan zwak of sterk zijn en positief of negatief zijn. De correlatie wordt berekend aan de hand van een statistische formule, deze draait achter de schermen van de cor()
functie in R. Bij het analyseren van data maak je gebruik van correlaties om te bekijken tussen welke verschillende variabelen er iets speelt. De volgende stap die je kunt nemen is verder kijken naar het verband, bijvoorbeeld onderzoek op welke manieren variabelen elkaar beïnvloeden. In R kun je echter alleen maar correlaties berekeningen met vectoren van het numeric
of integer
datatype.
Datatypes
Zoals je misschien al eerder gemerkt hebt tijdens het werken met R, kom je soms in de knoop met de verschillende datatypes. In dit hoofdstuk heb je kunnen zien dat dit zelfs kan gebeuren op momenten dat je het niet verwacht. Het is namelijk logisch om ervan uit te gaan dat een dataset met consumentenprijzen alleen maar kolommen bevat met numerieke waarden. Data-kwaliteit issues zoals lege waarden kunnen dit echter verpesten. Gelukkig zijn er genoeg handige manieren in R om met deze onhandigheden om te gaan, van het handmatig omzetten van een waarde tot het gebruik maken van handige functies.
Functies en loops
Functies zijn zeer krachtige functies in R. Door gebruik te maken van functies kun je namelijk veel herhaaldelijk werk besparen. Daarbij zijn functies eigenlijk de belangrijkste bouwstenen R. Alle packages in R zijn namelijk niets meer dan verzamelingen van functies die iemand anders een keer heeft ontwikkeld en beschikbaar heeft gesteld. Zo kun je ook tijdens je eigen R-sessie functies opslaan en deze later gebruiken. Net als vectoren en waarden, staan functies in RStudio in het rechtervenster onder Functions waar ook Data en Values staan. Ik kan je alleen maar aanmoedigen om zo veel mogelijk gebruik te maken van functies. Niet alleen om programmeren en data analyseren met R in de vingers te krijgen, maar ook voor programmeren in het algemeen. Functies, en het opslaan en distribueren hiervan, komen namelijk in iedere programmeertaal terug.