Tarea1 Vanesa Chaluiza – [DOCX Document]
UNIVERSIDAD CENTRAL DEL ECUADORFACULTAD DE CIENCIAS FSICAS Y MATEMTICASINFORMTICA
Nombre: Vanesa ChaluizaDeber: Instalacin de software R y paquetes.Materia: Minera de Datos
Ejercicio #2: Proceda a instalar la plataforma R, para esto siga los siguientes pasos: Baje R desde http://www.r-project.org/ o desde nuestro sitio web. www.promidat.com enherramientas/Bodega de programas. Instlelo en su computador.
Pgina de Instalacin. Descarga segn su versin del https://www.r-project.org/ sistema operativo.
Proceso de InstalacinPantalla Inicial del Software
Ejercicio #3: Proceda a instalar RStudio, para esto siga los siguientes pasos: Baje RStudio desde http://www.rstudio.com/ o desde nuestro sitio web. www.promidat.com en herramientas/Bodega de programas. Instlelo en su computador. Proceso de InstalacinPantalla Inicial del Software
Ejercicio #4: Proceda a instalar el paquete Rattle, para esto siga los pasos que se explican en el documento localizado en el Aula Virtual en la seccin de Material de Apoyo, denominado «Presentacin – Presentacin Software e Instalacin.PDF.
Entregar: Un «print screen» en el que se observe que ya est instalado Rattle sobre la plataforma R.
LIBRERA RATTLE
Ejercicio #5: Proceda a instalar el paquete FactoMineR, para esto siga los siguientes pasos que se explican en el documento localizado en el Aula Virtual en la seccin de Material de Apoyo, denominado «Presentacin – Presentacin Software e Instalacin.PDF.
Entregar: Un «print screen» en el que se vea que ya est instalado FactoMineR sobre la plataforma R.
FACTOMINER
Ejercicio #6: Explique las principales diferencias entre Estadstica y Minera de Datos.
La estadstica generalmente analiza muestras de datos para luego hacer inferencia a toda la poblacin, mientras que la minera de datos pretende buscar informacin til usando toda la base datos.
La estadstica en la mayora de los casos supone que los datos se comportan de acuerdo a ciertas distribuciones de probabilidad (normal, binomial, geomtrica, Poisson, etc), mientras que la minera de datos usa tcnicas mucho ms exploratorias que vienen de la IA, o del Analyse des Donnes.
A diferencia de la minera de datos, el anlisis de datos usualmente no es automatizado, ni trata con volmenes de datos tan grandes.
Ejercicio #7: Explique las principales diferencias entre una Base de Datos Operativa y una Bodega de Datos.
AspectosBD operacionalData Warehouse
ObjetivoDe tipo operativo (operaciones del da a da)Anlisis y toma de decisiones
ProcesoDe transacciones. Repetitivo y conocido.De consultas masivas. Puntual y no conocido.
ActividadPredomina la actualizacinPredomina la consulta
RendimientoImportancia del tiempo de respuesta de la transaccin instantneaImportancia de la respuesta masiva.
ExplotacinExplotacin de la informacin relacionada con la operativa de cada aplicacinExplotacin de toda la informacin interna y externa relacionada con el negocio
VolatilidadActualizableCarga, pero no actualizacin
UsuariosUsuarios de perfiles medios o bajosUsuarios de perfiles altos
OrganizacinEstructura normalmente relacionalVisin multidimensional
GranularidadDatos generales desagregados, al detalleDatos en distintos niveles de detalle y agregacin
Horizonte histrico30 a 90 das5 a 10 aos
PerspectivaImportancia del dato actualImportancia del dato histrico
Volumen de datosPequeo/medio. Del orden del Mb a Gb.Medio/grande. Del orden del Gb a Tb.