3.- OLAP OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP ) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP ). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de vista operativo, es una base de datos multidimensional . La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE. Funcionalidad En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (también llamado cubo multidimensional o hipercubo ). Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es típicamente creado a partir de un esquema en estrella o copo de nieve , esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensión de los cuadros. Tipos de sistemas OLAP
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
3- OLAP
OLAP es el acroacutenimo en ingleacutes de procesamiento analiacutetico en liacutenea (On-Line Analytical Processing) Es una solucioacuten utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP) Se usa en informes de negocios de ventas marketing informes de direccioacuten mineriacutea de datos y aacutereas similares
La razoacuten de usar OLAP para las consultas es la velocidad de respuesta Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta Un modelo mejor para buacutesquedas aunque peor desde el punto de vista operativo es una base de datos multidimensional
La principal caracteriacutestica que potencia a OLAP es que es lo maacutes raacutepido a la hora de ejecutar sentencias SQL de tipo SELECT en contraposicioacuten con OLTP que es la mejor opcioacuten para operaciones de tipo INSERT UPDATE Y DELETE
Funcionalidad
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambieacuten llamado cubo multidimensional o hipercubo) Se compone de hechos numeacutericos llamados medidas que se clasifican por dimensiones El cubo de metadatos es tiacutepicamente creado a partir de un esquema en estrella o copo de nieve esquema de las tablas en una base de datos relacional Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensioacuten de los cuadros
Tipos de sistemas OLAP
Tradicionalmente los sistemas OLAP se clasifican seguacuten las siguientes categoriacuteas
ROLAP
Implementacioacuten OLAP que almacena los datos en un motor relacional Tiacutepicamente los datos son detallados evitando las agregaciones y las tablas se encuentran normalizadas Los esquemas maacutes comunes sobre los que se trabaja son estrella oacute copo de nieve aunque es posible trabajar sobre cualquier base de datos relacional La arquitectura estaacute compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado La principal ventaja de esta arquitectura es que permite el anaacutelisis de una enorme cantidad de datos
MOLAP
Esta implementacioacuten OLAP almacena los datos en una base de datos multidimensional Para optimizar los tiempos de respuesta el resumen de la informacioacuten es usualmente calculado por adelantado Estos valores precalculados o agregaciones son la base de las ganancias de desempentildeo de este sistema Algunos sistemas utilizan teacutecnicas de compresioacuten de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados
HOLAP (Hybrid OLAP)
Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional
Comparacioacuten
Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las caracteriacutesticas especiacuteficas de los beneficios entre los proveedores)
Algunas implementaciones MOLAP son propensas a la explosioacuten de la base de datos este fenoacutemeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones elevado nuacutemero de dimensiones resultados precalculados y escasos datos multidimensionales Las teacutecnicas habituales de atenuacioacuten de la explosioacuten de la base de datos no son todo lo eficientes que seriacutea deseable
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacioacuten y a las optimizaciones de almacenamiento MOLAP tambieacuten necesita menos espacio de almacenamiento en comparacioacuten con los especializados ROLAP porque su almacenamiento especializado normalmente incluye teacutecnicas de compresioacuten
ROLAP es generalmente maacutes escalable Sin embargo el gran volumen de reprocesamiento es difiacutecil de implementar eficientemente por lo que con frecuencia se omiten por tanto el rendimiento de una consulta ROLAP puede verse afectado
Desde la aparicioacuten de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar caacutelculos las funciones especializadas que se pueden utilizar tienen maacuteas limitaciones
HOLAP (OLAP Hiacutebrido) engloba un conjunto de teacutecnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible Generalmente puede pre-procesar raacutepidamente escala bien y proporciona una buena funcioacuten de apoyo
31 Procesamiento Analiacutetico en Liacutenea
En un almaceacuten de datos a diferencia de un OLTP se realizan operaciones de procesamiento analiacutetico en liacutenea (ldquoOLAP - On-Line Analytical Processingrdquo) cuya operacioacuten consiste principalmente de consultas sobre grandes voluacutemenes de datos y de
proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente
Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas
En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales
Modelos multidimensionales
Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto
Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos
Ejemplo de diagrama ER
Esquemas relacionales para modelado multidimensional
Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten
Los conceptos de dimensioacuten y hechos
La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos
transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones
La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra
Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos
Esquemas para representar modelos multidimensionales
a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional
El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Esta implementacioacuten OLAP almacena los datos en una base de datos multidimensional Para optimizar los tiempos de respuesta el resumen de la informacioacuten es usualmente calculado por adelantado Estos valores precalculados o agregaciones son la base de las ganancias de desempentildeo de este sistema Algunos sistemas utilizan teacutecnicas de compresioacuten de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados
HOLAP (Hybrid OLAP)
Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional
Comparacioacuten
Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las caracteriacutesticas especiacuteficas de los beneficios entre los proveedores)
Algunas implementaciones MOLAP son propensas a la explosioacuten de la base de datos este fenoacutemeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones elevado nuacutemero de dimensiones resultados precalculados y escasos datos multidimensionales Las teacutecnicas habituales de atenuacioacuten de la explosioacuten de la base de datos no son todo lo eficientes que seriacutea deseable
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacioacuten y a las optimizaciones de almacenamiento MOLAP tambieacuten necesita menos espacio de almacenamiento en comparacioacuten con los especializados ROLAP porque su almacenamiento especializado normalmente incluye teacutecnicas de compresioacuten
ROLAP es generalmente maacutes escalable Sin embargo el gran volumen de reprocesamiento es difiacutecil de implementar eficientemente por lo que con frecuencia se omiten por tanto el rendimiento de una consulta ROLAP puede verse afectado
Desde la aparicioacuten de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar caacutelculos las funciones especializadas que se pueden utilizar tienen maacuteas limitaciones
HOLAP (OLAP Hiacutebrido) engloba un conjunto de teacutecnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible Generalmente puede pre-procesar raacutepidamente escala bien y proporciona una buena funcioacuten de apoyo
31 Procesamiento Analiacutetico en Liacutenea
En un almaceacuten de datos a diferencia de un OLTP se realizan operaciones de procesamiento analiacutetico en liacutenea (ldquoOLAP - On-Line Analytical Processingrdquo) cuya operacioacuten consiste principalmente de consultas sobre grandes voluacutemenes de datos y de
proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente
Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas
En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales
Modelos multidimensionales
Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto
Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos
Ejemplo de diagrama ER
Esquemas relacionales para modelado multidimensional
Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten
Los conceptos de dimensioacuten y hechos
La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos
transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones
La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra
Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos
Esquemas para representar modelos multidimensionales
a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional
El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente
Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas
En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales
Modelos multidimensionales
Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto
Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos
Ejemplo de diagrama ER
Esquemas relacionales para modelado multidimensional
Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten
Los conceptos de dimensioacuten y hechos
La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos
transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones
La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra
Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos
Esquemas para representar modelos multidimensionales
a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional
El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Ejemplo de diagrama ER
Esquemas relacionales para modelado multidimensional
Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten
Los conceptos de dimensioacuten y hechos
La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos
transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones
La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra
Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos
Esquemas para representar modelos multidimensionales
a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional
El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones
La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra
Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos
Esquemas para representar modelos multidimensionales
a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional
El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Modelo de estrella con 3 dimensiones y una tabla de hechos
Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos
1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet
2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1
b) Modelo de copo de nieve (ldquosnow flake schemardquo)
El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas
Modelo de copo de nieve
b) Modelo de constelaciones
El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia
Esquema de constelaciones
Operaciones con cubos
Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son
a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)
b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)
c) Filtrar
d) Pivotear
Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo
La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente
Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar
Operaciones sobre cubos especializar y generalizar
Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo
311 Servidores de Procesamiento Analiacutetico en Liacutenea
El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras
Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones
En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones
En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional
312 Utilizacioacuten de las Herramientas OLAP
Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando
El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones
32 Oracle OLAP
Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores
Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas
Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente
Arquitectura con base de datos Oracle integrada
Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados
Gestioacuten maacutes simple Alta disponibilidad
Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API
Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten
La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas
La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos
La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional
Componentes Oracle Database OLAP
SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional
Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada
Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle
En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces
Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML
MODELO LOacuteGICO EN LA OLAP API
El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son
o Es faacutecilmente entendible por los usuarios no expertos
o Proporciona el contexto para la seleccioacuten de datos
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no
expertos pueden usar el lenguaje de caacutelculo
El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos
Medidas
Dimensiones
Niveles
Jerarquiacuteas
Atributos
Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc
Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes
o El modelo fuerza la integridad referencial Por ejemplo no es posible
que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten
o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de
dimensiones con muacuteltiples medidas
o El orden de los miembros de las dimensiones se mantiene Esto
simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales
o Toda la base de datos se presenta como precalculada sin tener en cuenta
si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle
Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes
33 Ejercicio con OLAP
Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca
Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Este password se usara en el momento de publicar el cubo en el portal de Pentaho
Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files
Nota Antes de empezar el servicio de la base de datos debe estar activo
Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente
El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada
A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Seguido de esto viene la creacioacuten de las dimensiones del cubo
Seleccionando el campo y dando clic en Add new dimension
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo
Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Si es exitosa la publicacioacuten debe salir
Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Y se ingresa en NavigateSoluciones
Una vez alliacute entramos en Ejemplos de Anaacutelisis
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten
Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos
El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten