jueves, 16 de junio de 2016

KNIME

UNIVERSIDAD TÈCNICA DE COTOPAXI
UNIDAD ACADÈMICA DE CIENCIAS DE LA INGENIERÌA Y APLICADAS
ING. EN INFORMÀTICA Y SISTEMAS COMPUTACIONALES



TEMA: 

HERRAMIENTAS PARA REALIZAR MINERÌA DE DATOS


INTEGRANTES:

GABRIELA CUYO

ISABEL PASTE


CURSO:

7mo


MATERIA:

NTIC`S


DOCENTE:

UNG. SILVIA BRAVO


FECHA DE ENTREGA :

16 DE JUNIO DEL 2016








HERRAMIENTAS PARA REALIZAR MINERÌA DE DATOS

MINERIA DE DATOS
Es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.

GENERALIDADES SOBRE LAS HERRAMIENTAS PARA REALIZAR MINERIA DE DATOS
El Data Mining es una de las principales herramientas que se utilizan dentro de los programas de gestión del conocimiento como soporte a la toma de decisiones. El fin es la extracción de información oculta o análisis de datos mediante técnicas estadísticas de grandes bases de datos. Las herramientas de data Mining o minería de datos pueden responder a preguntas de negocios empresariales a priori no planteadas o que pueden consumir demasiado tiempo para ser resueltas. Las técnicas de data Mining se centran en analizar el gran volumen de datos. En definitiva, la minería de datos es una tecnología usada para descubrir información oculta y desconocida, pero potencialmente útil, a partir de las fuentes de información de la propia empresa. Obtiene un conocimiento de un negocio, utilizando técnicas de clustering, redes neuronales, árboles de decisión y reglas de asociación etc.

Es, por tanto, un campo multidisciplinar que cubre numerosas áreas y se aborda desde múltiples puntos de vista, como la estadística, la informática (cálculo automático) o la ingeniería. Técnicas de las herramientas de minería de datos. 
Redes neuronales 
  • Red lineal 
  • Árbol de decisión
  •  Modelo estadístico
  •  Agrupamiento



CARACTERISTICAS DE LAS HERRAMIENTAS DE MINERÌA DE DATOS
  •   Fácil entendimiento de los datos.
  •   Visualización interactiva.
  •   Poderosa preparación de los datos.
  •   Combina datos de múltiples fuentes.
  •   Especifica valores perdidos.
  •   Deriva nuevas variables.
  •   Produce información resumida.
  •   Incrementa la productividad con su enfoque visual de la manipulación de datos.
  •   Técnicas de Modelado.
  •   Técnicas Supervisadas: C&RT, Redes Neuronales, C5.0, Quest, CHAID, Regresión Lineal y Regresión Logística.
  •   Técnicas No Supervisadas: K-medias, Kohonen, Bi-etápico, Apriori, GRI, Sequence, Carma, Detección de Anomalías.
  •   Técnicas de Evaluación: Tablas Estadísticas, Gráficos de Ganancia y ROI.



HERRAMIENTA DE MIENERÌA DE DATOS KNIME


KNIME (Konstanz Information Miner) es una plataformade código abierto de fácil uso y comprensible para integración de datos, procesamiento, análisis, y exploración. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías de datos, ejecutar selectivamente algunos o todos los pasos de análisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de sus métodos de extensión para soportar plugins proporcionando así una funcionalidad adicional. 
CARACTERÍSTICAS
  • Escalabilidad debido a la manipulación avanzada de datos
  • Extensibilidad mediante API para la realización de pluginsInterfaz de usuario intuitiva.
  • Importación y exportación de flujos de trabajo
  • Ejecución en paralelo en los sistemas multi-core
  • Versión de línea de comandos para las ejecuciones “batch”
  • Entrada/Salida: Recupera datos de archivos o bases de datos
FUNCIONALIDADES
  • Manipulación de datos: Pre-procesa datos de entrada con filtrado, group-by, pivotaje, normalización, agregación, unión, muestreo, partición,…
  • Vistas: Visualizar los datos y resultados a través de varias vistas interactivas, que permite la exploración de los datos
  • Minería de datos: utiliza algoritmos de minería de datos de última generación como la segmentación, reglas de inducción, árboles de decisión, reglas de asociación, Naïve Bayes, redes neuronales, SVM, etc, para analizar y comprender mejor sus datos
INSTALACIÒN KNIME
descargar la herramienta del link www.knime.org

EJECUCIÒN
Busque el fichero knime.exe y ejecutelo



antes de instalar debemos instalar los componentes de WEka utilizando la opcion "Get additional nodes de la ventana de inicio KNIME "

Seleccionar de la lista https://www.knime.org/update/2.5 y luego en filtro seleccionar WEKA Extensions



PARTES DE LA HERRAMIENTA




MANUAL DE USO DE LA HERRAMIENTA DE MINERÌA DE DATOS KNIME

CREAR UN PROYECTO
Elegimos la opcion nuevo Knime Workflow y damos un nombre al proyecto



CONSTRUIR UN FLUJO DE DATOS

Se construye un flujo de datos arrastrando y soltando (drag & drop) editando los nodos y conectandolos entre ellos.

Los datos se transportan entre los nodos a travès  de los puertos de entrada y salida 




EJECUCION DE UN NODO

Dar click derecho y seleccionar "Execute"






FUENTES BIBLIOGRAFICAS
  • https://www.knime.org/knime-online-self-training-lesson-5
  • http://sci2s.ugr.es/sites/default/files/files/Teaching/GraduatesCourses/InteligenciaDeNegocio/manual_basico_knime.pdf
  • http://blog.jmacoe.com/gestion_ti/base_de_datos/5-mejores-software-mineria-datos-codigo-libre-abierto/






No hay comentarios.:

Publicar un comentario