UNIVERSIDAD TÈCNICA DE COTOPAXI
UNIDAD ACADÈMICA DE CIENCIAS DE LA INGENIERÌA Y APLICADAS
ING. EN INFORMÀTICA Y SISTEMAS COMPUTACIONALES
TEMA:
HERRAMIENTAS PARA REALIZAR MINERÌA DE DATOS
INTEGRANTES:
GABRIELA CUYO
ISABEL PASTE
CURSO:
7mo
MATERIA:
NTIC`S
DOCENTE:
UNG. SILVIA BRAVO
FECHA DE ENTREGA :
16 DE JUNIO DEL 2016
HERRAMIENTAS PARA REALIZAR MINERÌA DE DATOS
MINERIA DE DATOS
Es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.
GENERALIDADES SOBRE LAS HERRAMIENTAS PARA REALIZAR MINERIA DE DATOS
El Data Mining es una de las principales
herramientas que se utilizan dentro de los programas de gestión del
conocimiento como soporte a la toma de decisiones. El fin es la extracción de
información oculta o análisis de datos mediante técnicas estadísticas de
grandes bases de datos. Las herramientas de data Mining o minería de datos
pueden responder a preguntas de negocios empresariales a priori no planteadas o
que pueden consumir demasiado tiempo para ser resueltas. Las técnicas de data
Mining se centran en analizar el gran volumen de datos. En definitiva, la
minería de datos es una tecnología usada para descubrir información oculta y
desconocida, pero potencialmente útil, a partir de las fuentes de información
de la propia empresa. Obtiene un conocimiento de un negocio, utilizando
técnicas de clustering, redes neuronales, árboles de decisión y reglas de
asociación etc.
Es,
por tanto, un campo multidisciplinar que cubre numerosas áreas y se aborda
desde múltiples puntos de vista, como la estadística, la informática (cálculo
automático) o la ingeniería. Técnicas de las herramientas de minería de datos.
Redes neuronales
- Red lineal
- Árbol de decisión
- Modelo estadístico
- Agrupamiento
CARACTERISTICAS DE LAS HERRAMIENTAS DE MINERÌA DE DATOS
- Fácil entendimiento de los datos.
- Visualización interactiva.
- Poderosa preparación de los datos.
- Combina datos de múltiples fuentes.
- Especifica valores perdidos.
- Deriva nuevas variables.
- Produce información resumida.
- Incrementa la productividad con su enfoque visual de la manipulación de datos.
- Técnicas de Modelado.
- Técnicas Supervisadas: C&RT, Redes Neuronales, C5.0, Quest, CHAID, Regresión Lineal y Regresión Logística.
- Técnicas No Supervisadas: K-medias, Kohonen, Bi-etápico, Apriori, GRI, Sequence, Carma, Detección de Anomalías.
- Técnicas de Evaluación: Tablas Estadísticas, Gráficos de Ganancia y ROI.
HERRAMIENTA DE MIENERÌA DE DATOS KNIME
KNIME (Konstanz
Information Miner) es una plataformade código abierto de fácil uso y
comprensible para integración de datos, procesamiento, análisis, y exploración.
Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías
de datos, ejecutar selectivamente algunos o todos los pasos de
análisis, y luego estudiar los resultados, modelos y vistas
interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de
sus métodos de extensión para soportar plugins proporcionando así una
funcionalidad adicional.
CARACTERÍSTICAS
- Escalabilidad debido a la
manipulación avanzada de datos
- Extensibilidad mediante API
para la realización de pluginsInterfaz de usuario intuitiva.
- Importación y exportación de
flujos de trabajo
- Ejecución en paralelo en los
sistemas multi-core
- Versión de línea de comandos
para las ejecuciones “batch”
- Entrada/Salida: Recupera datos
de archivos o bases de datos
FUNCIONALIDADES
- Manipulación de datos:
Pre-procesa datos de entrada con filtrado, group-by, pivotaje,
normalización, agregación, unión, muestreo, partición,…
- Vistas: Visualizar los datos y
resultados a través de varias vistas interactivas, que permite la
exploración de los datos
- Minería de datos: utiliza
algoritmos de minería de datos de última generación como la segmentación,
reglas de inducción, árboles de decisión, reglas de asociación, Naïve
Bayes, redes neuronales, SVM, etc, para analizar y comprender mejor sus
datos
INSTALACIÒN KNIME
descargar la herramienta del link www.knime.org
EJECUCIÒN
Busque el fichero knime.exe y ejecutelo
antes de instalar debemos instalar los componentes de WEka utilizando la
opcion "Get additional nodes de la ventana de inicio KNIME "
Seleccionar de la lista https://www.knime.org/update/2.5 y luego en filtro
seleccionar WEKA Extensions
PARTES DE LA HERRAMIENTA
MANUAL DE USO DE LA HERRAMIENTA DE MINERÌA
DE DATOS KNIME
CREAR UN PROYECTO
Elegimos la opcion nuevo Knime Workflow y damos un nombre al proyecto
CONSTRUIR UN FLUJO DE DATOS
Se construye un flujo de datos arrastrando y soltando (drag & drop)
editando los nodos y conectandolos entre ellos.
Los datos se transportan entre los nodos a travès de los puertos de
entrada y salida
EJECUCION DE UN NODO
Dar click derecho y seleccionar "Execute"
FUENTES BIBLIOGRAFICAS
- https://www.knime.org/knime-online-self-training-lesson-5
- http://sci2s.ugr.es/sites/default/files/files/Teaching/GraduatesCourses/InteligenciaDeNegocio/manual_basico_knime.pdf
- http://blog.jmacoe.com/gestion_ti/base_de_datos/5-mejores-software-mineria-datos-codigo-libre-abierto/