DataminingNieuw

StandaardenOpen source softwareSubdomein van

Beschrijving

Datamining is een techniek die toelaat om patronen te destilleren uit een grote hoeveelheid gegevens. Op basis van deze patronen kan men dan een beter inzicht ("kennis") verwerven in de achterliggende gegevens.  Datamining maakt gebruik van methodes afkomstig uit andere domeinen zoals onder andere statistiek, artificial intelligence en database management. 

Er zijn twee belangrijke manieren waarvoor men datamining kan gebruiken:

  • het beschrijven van een grote hoeveelheid gegevens (descriptive analytics). Zo kan men bijvoorbeeld bepaalde categoriëen in een dataset herkennen (cluster analysis) of afhankelijkheden tussen verschillende types data ontdekken (association rule mining).
  • het voorspellen van toekomstige trends en gegevens op basis van de huidige data (predictive analytics). Dit kan men bijvoorbeeld doen aan de hand van beslissingsbomen (decision trees) of neurale netwerken (neural networks).

Open source software

Open source software: R, Weka

Standaarden

Er is momenteel geen lijst van standaarden beschikbaar.

Heeft u opmerkingen of vragen over deze tekst? Laat het ons weten
Laatst gewijzigd op 28/11/2011