Resumen:
RESUMEN
La minería de datos es una tecnología de información que involucra los métodos de análisis
tradicionales con algoritmos sofisticados para procesar grandes volúmenes de información, en
esta tesina se trata el uso de la minería de datos en un campo práctico como lo es el diseño de
cuestionarios, se exponen la metodología utilizada para la realización de la minería de datos,
así como los resultados obtenidos.
La contribución de este trabajo práctico y de investigación, se centra en la propuesta de la
utilización de la minería de datos en apoyo a los procesos de generación de información hacia
los usuarios basándose principalmente en la metodología CRISP-DM (CRoss-Industry Standard
Process for Data Mining) así como el uso de herramientas tales como WEKA, STATISTICA y
RATTLE.
En base a la metodología CRISP-DM se desarrolla el proyecto de minería de datos sobre los
datos del XII Censo de Población y Vivienda del año 2000, con el objetivo de mejorar el diseño
del cuestionario del Censo 2010.
Se exponen las diferentes fases del desarrollo de un proyecto de minería de datos, así como la
aplicación de diversas herramientas de software en cada una de ellas, el desarrollo de la
tarea de predicción de la minería de datos, en la cual se han utilizado las redes neuronales las
cuales son colecciones de nodos con entradas, salidas y procesamiento en cada nodo, entre la
entrada y la salida existen un número de capas ocultas de procesamiento.
Palabras claves:
Diseño de cuestionarios, Minería de Datos, Data Warehouse, Redes neuronales, Ingreso.