tarea1 vanesa chaluiza

Download Tarea1 Vanesa Chaluiza

Post on 31-Jan-2016

224 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

campo

TRANSCRIPT

UNIVERSIDAD CENTRAL DEL ECUADORFACULTAD DE CIENCIAS FSICAS Y MATEMTICASINFORMTICA

Nombre: Vanesa ChaluizaDeber: Instalacin de software R y paquetes.Materia: Minera de Datos

Ejercicio #2: Proceda a instalar la plataforma R, para esto siga los siguientes pasos: Baje R desde http://www.r-project.org/ o desde nuestro sitio web. www.promidat.com enherramientas/Bodega de programas. Instlelo en su computador.

Pgina de Instalacin. Descarga segn su versin del https://www.r-project.org/ sistema operativo.

Proceso de InstalacinPantalla Inicial del Software

Ejercicio #3: Proceda a instalar RStudio, para esto siga los siguientes pasos: Baje RStudio desde http://www.rstudio.com/ o desde nuestro sitio web. www.promidat.com en herramientas/Bodega de programas. Instlelo en su computador. Proceso de InstalacinPantalla Inicial del Software

Ejercicio #4: Proceda a instalar el paquete Rattle, para esto siga los pasos que se explican en el documento localizado en el Aula Virtual en la seccin de Material de Apoyo, denominado "Presentacin - Presentacin Software e Instalacin.PDF.

Entregar: Un "print screen" en el que se observe que ya est instalado Rattle sobre la plataforma R.

LIBRERA RATTLE

Ejercicio #5: Proceda a instalar el paquete FactoMineR, para esto siga los siguientes pasos que se explican en el documento localizado en el Aula Virtual en la seccin de Material de Apoyo, denominado "Presentacin - Presentacin Software e Instalacin.PDF.

Entregar: Un "print screen" en el que se vea que ya est instalado FactoMineR sobre la plataforma R.

FACTOMINER

Ejercicio #6: Explique las principales diferencias entre Estadstica y Minera de Datos.

La estadstica generalmente analiza muestras de datos para luego hacer inferencia a toda la poblacin, mientras que la minera de datos pretende buscar informacin til usando toda la base datos.

La estadstica en la mayora de los casos supone que los datos se comportan de acuerdo a ciertas distribuciones de probabilidad (normal, binomial, geomtrica, Poisson, etc), mientras que la minera de datos usa tcnicas mucho ms exploratorias que vienen de la IA, o del Analyse des Donnes.

A diferencia de la minera de datos, el anlisis de datos usualmente no es automatizado, ni trata con volmenes de datos tan grandes.

Ejercicio #7: Explique las principales diferencias entre una Base de Datos Operativa y una Bodega de Datos.

AspectosBD operacionalData Warehouse

ObjetivoDe tipo operativo (operaciones del da a da)Anlisis y toma de decisiones

ProcesoDe transacciones. Repetitivo y conocido.De consultas masivas. Puntual y no conocido.

ActividadPredomina la actualizacinPredomina la consulta

RendimientoImportancia del tiempo de respuesta de la transaccin instantneaImportancia de la respuesta masiva.

ExplotacinExplotacin de la informacin relacionada con la operativa de cada aplicacinExplotacin de toda la informacin interna y externa relacionada con el negocio

VolatilidadActualizableCarga, pero no actualizacin

UsuariosUsuarios de perfiles medios o bajosUsuarios de perfiles altos

OrganizacinEstructura normalmente relacionalVisin multidimensional

GranularidadDatos generales desagregados, al detalleDatos en distintos niveles de detalle y agregacin

Horizonte histrico30 a 90 das5 a 10 aos

PerspectivaImportancia del dato actualImportancia del dato histrico

Volumen de datosPequeo/medio. Del orden del Mb a Gb.Medio/grande. Del orden del Gb a Tb.