R
| Versie | 2.13.x |
| Officiële website | http://www.r-project.org/ |
| Licentiemodel | GPL v2 |
| Behoort tot de domeinen | Datamining
|
Aanbevelingen
R werd meer dan tien jaar geleden ontwikkeld door statistici en is een uiterst lichte en efficiënte software (en taal) die gericht is op de statistische verwerking van gegevens. Het is de referentie van de wetenschappelijke statistiek.
R biedt de volgende functionaliteiten aan:
- Gebruikelijke toetsen van statistieken, genereren van toevalsgetallen, verschillende wetten, statistische tabellen, enz.
- Flexibel en parametreerbaar beheer van statistische grafieken (histogram, boxplot)
- In de bijkomende library's, implementatie van zeer geavanceerde technieken voor de behandeling van gegevens, voor statistieken en voor datamining (beheer van de matrixberekeningen, lineaire modellen, analyses in hoofdcomponenten, chronologische series, neurale netwerken, analyse van grafieken) maar ook voor cartografie, beeldanalyse…
- Toegang tot de code van de statistische functies, wat de controle van de berekeningstechnieken en -hypotheses mogelijk maakt.
- Ontwikkelde online mailing list en documentatie, zowel op informaticaniveau als op statistisch niveau.
De nadelen zijn:
- Een opdrachtregelinterface, wat een zekere leertijd vraagt.
- De geanalyseerde tabellen worden opgeslagen in het geheugen, wat de verwerking van tabellen van meer dan enkele gigabytes onmogelijk maakt.
- De modules zijn grotendeels ontwikkeld door universiteiten en zijn vaak aangepast aan specifieke gebieden, met een bijzondere terminologie (leefmilieu, aardrijkskunde, psychologie…).
Beschrijving
De taal
R is tegelijk een softwarepakket en een taal, oorspronkelijk gebaseerd op S.
De gebruikte taal maakt lussen, vertakkingen en functieprogrammering mogelijk.
|
Voorbeelden van code: Een matrix aanmaken, ze vermenigvuldigen met haar transpositie:
Gegevens samenvatten:
Een functie aanmaken:
|
Voornaamste functionaliteiten
Behandeling van gegevens
R kan brongegevens importeren vanuit verschillende formaten, CSV, Excel, enz. maar ook via SQL-query's, op bepaalde DBMS'en. Zodra de gegevens in het geheugen zitten, kunnen zij worden opgeslagen in het R-formaat of worden geëxporteerd naar andere formaten, behandeld, gesorteerd, gefilterd, enz.
Productie van resultaten in de vorm van een object
Een berekening heeft als resultaat de creatie van een geïndexeerd object in de vorm van een lijst of vector, wat later een automatische verwerking mogelijk maakt.
|
Voorbeeld Het resultaat van de Student-toets (functie t-toets) is een lijst van 9 componenten:
Als men iteratief een berekeningssimulatie van deze test uitvoert, zal men daarna de resultaten van deze simulaties kunnen vergelijken, op basis van de p-waarde, bijvoorbeeld, door de verschillende resultaten te verzamelen in een vector (Resultat.t.test [[3]]). |
Export van grafieken
De gegenereerde grafieken kunnen geëxporteerd worden in de formaten PDF en Jpeg en kunnen opnieuw geïmporteerd worden in Inkscape of een ander programma.
Bijkomende packages
De installatie van R omvat standaard enkele packages (stat, graph, base) en kan makkelijk aangevuld worden met een groot aantal bijkomende library's (er zijn er meer dan 2000 beschikbaar) afhankelijk van de behoeften.
![]() |
| Klik om te vergroten |
Vergelijking met andere software:
R gebruikt een andere syntaxis dan Scilab, de vrije wiskundige software, en dan Matlab, maar er zitten wel vertrouwde elementen in (basis van C).
De logica en de werking van R verschillen zeer sterk van SAS (functionele taal, geen procedurele). Statistici die SAS gebruiken, zullen in R de heel eenvoudige implementatie van basisfuncties, de striktheid van de testen en de kwaliteit van de grafieken op prijs stellen. Het terugzenden van resultaten in de vorm van objecten is erg praktisch. Het ontbreken van de mogelijkheid om de gegevens te manipuleren via SQL is een beperking.
Gebruik van R mogelijk vanaf andere software:
- Excel, via het project RExcel van Statconn: maakt het mogelijk commando's van R op te roepen in Excel
- Sas: via de IML-licentie, mogelijkheid om R-functies te gebruiken en gegevens te transfereren tussen de twee programma's
- Er bestaan teksteditors voor R, bijvoorbeeld Tinn-R, voor Windows.




