¿Qué entedemos por data mining?
Hoy quiero hablar un poco de data mining. Academicamente hablando entendemos por data mining el proceso de obtención de patrones a partir de los datos disponibles.
La idea del data mining es obtener información sobre los datos que no se puede extrapolar a simple vista.Para llevar a cabo este proceso se utilizan algoritmos matemáticos aplicados a ese conjunto de datos que permiten predecir el comportamiento de las diferentes variables de dichos datos y hacer así predicciones,clasificaciones y aprenentaje entre otras cosas.
El data mining tiene aplicaciones en muchos campos de hoy en día. Se utiliza en investigación científica, en el mundo de las ventas,en el mundo del marketing,etc…
En relación con el Business Intelligence y los proyectos de análisis de datos, el data mining representa el punto más alto de la piramide informacional. Se trata de la disciplina que permite hacer predicciones y reflejar comportamientos futuros de los datos.
Evidentemente esta definición es totalmente simplificada pero espero que permita entender de una forma sencilla que entendemos por data mining.
Existen muchas herramientas para realizar data mining. Sin embargo os hablaré de algunas de ellas.
SPSS: Herramienta líder en el mercado del data mining,propiedad de IBM ofrece diferentes soluciones relacionadas con el data mining.
SAS: Las herramientas para data mining del gigante del tratamiento de datos lideran también el mercado de las herramientas propietarias.
A nivel de aplicaciones open source existen dos productos que lideran el mercado.
Weka: Herramienta de data mining surgida del entorno universitario. Con diferentes herramientas para el tratamiento de datos es una de las soluciones lideres en el mercado open source. Actualmente está integrado en la suite Pentaho.
R: Software estadístico generalista que ofrece también funcionalidades de data mining y clasificación de datos.
Espero que este post os ayude a entender algo más sobre el mundo del data mining.
data mining












[...] This post was mentioned on Twitter by Enric Biosca, Cosme Fulanito. Cosme Fulanito said: Minería de datos sencillito: http://www.enricbiosca.es/2010/05/%C2%BFque-entedemos-por-data-mining.html [...]