R

Versie2.13.x
Officiële websitehttp://www.r-project.org/
LicentiemodelGPL v2
Behoort tot de domeinenDatamining

Aanbevelingen

R werd meer dan tien jaar geleden ontwikkeld door statistici en is een uiterst lichte en efficiënte software (en taal) die gericht is op de statistische verwerking van gegevens. Het is de referentie van de wetenschappelijke statistiek.

R biedt de volgende functionaliteiten aan:

  • Gebruikelijke toetsen van statistieken, genereren van toevalsgetallen, verschillende wetten, statistische tabellen, enz.
  • Flexibel en parametreerbaar beheer van statistische grafieken (histogram, boxplot)
  • In de bijkomende library's, implementatie van zeer geavanceerde technieken voor de behandeling van gegevens, voor statistieken en voor datamining (beheer van de matrixberekeningen, lineaire modellen, analyses in hoofdcomponenten, chronologische series, neurale netwerken, analyse van grafieken) maar ook voor cartografie, beeldanalyse…
  • Toegang tot de code van de statistische functies, wat de controle van de berekeningstechnieken en -hypotheses mogelijk maakt.
  • Ontwikkelde online mailing list en documentatie, zowel op informaticaniveau als op statistisch niveau.

De nadelen zijn:

  • Een opdrachtregelinterface, wat een zekere leertijd vraagt.
  • De geanalyseerde tabellen worden opgeslagen in het geheugen, wat de verwerking van tabellen van meer dan enkele gigabytes onmogelijk maakt.
  • De modules zijn grotendeels ontwikkeld door universiteiten en zijn vaak aangepast aan specifieke gebieden, met een bijzondere terminologie (leefmilieu, aardrijkskunde, psychologie…).

Beschrijving

De taal

R is tegelijk een softwarepakket en een taal, oorspronkelijk gebaseerd op S.

De gebruikte taal maakt lussen, vertakkingen en functieprogrammering mogelijk.

Voorbeelden van code:

Een matrix aanmaken, ze vermenigvuldigen met haar transpositie:

R_matrix

Gegevens samenvatten: 

R_summary

Een functie aanmaken:  

R_function

Voornaamste functionaliteiten

Behandeling van gegevens 

R kan brongegevens importeren vanuit verschillende formaten, CSV, Excel, enz. maar ook via SQL-query's, op bepaalde DBMS'en. Zodra de gegevens in het geheugen zitten, kunnen zij worden opgeslagen in het R-formaat of worden geëxporteerd naar andere formaten, behandeld, gesorteerd, gefilterd, enz.

Productie van resultaten in de vorm van een object 

Een berekening heeft als resultaat de creatie van een geïndexeerd object in de vorm van een lijst of vector, wat later een automatische verwerking mogelijk maakt.

Voorbeeld 

Het resultaat van de Student-toets (functie t-toets) is een lijst van 9 componenten:

R_teststudent

Als men iteratief een berekeningssimulatie van deze test uitvoert, zal men daarna de resultaten van deze simulaties kunnen vergelijken, op basis van de p-waarde, bijvoorbeeld, door de verschillende resultaten te verzamelen in een vector (Resultat.t.test [[3]]).

Export van grafieken 

De gegenereerde grafieken kunnen geëxporteerd worden in de formaten PDF en Jpeg en kunnen opnieuw geïmporteerd worden in Inkscape of een ander programma.

Bijkomende packages 

De installatie van R omvat standaard enkele packages (stat, graph, base) en kan makkelijk aangevuld worden met een groot aantal bijkomende library's (er zijn er meer dan 2000 beschikbaar) afhankelijk van de behoeften.

R_interface
Klik om te vergroten

Vergelijking met andere software:

R gebruikt een andere syntaxis dan Scilab, de vrije wiskundige software, en dan Matlab, maar er zitten wel vertrouwde elementen in (basis van C).

De logica en de werking van R verschillen zeer sterk van SAS (functionele taal, geen procedurele). Statistici die SAS gebruiken, zullen in R de heel eenvoudige implementatie van basisfuncties, de striktheid van de testen en de kwaliteit van de grafieken op prijs stellen. Het terugzenden van resultaten in de vorm van objecten is erg praktisch. Het ontbreken van de mogelijkheid om de gegevens te manipuleren via SQL is een beperking.

Gebruik van R mogelijk vanaf andere software:

  • Excel, via het project RExcel van Statconn: maakt het mogelijk commando's van R op te roepen in Excel
  • Sas: via de IML-licentie, mogelijkheid om R-functies te gebruiken en gegevens te transfereren tussen de twee programma's
  • Er bestaan teksteditors voor R, bijvoorbeeld Tinn-R, voor Windows.
Heeft u opmerkingen of vragen over deze tekst? Laat het ons weten
Laatst gewijzigd op 04/10/2011