Introducción Bussines Intelligence Jorge Soro Doménech Mistela And Tweets
Introducción Bussines Intelligence
Jorge Soro Doménech
Mistela And Tweets
INDICE 1. SISTEMA OPERACIONAL 2. DATAWAREHOUSE 3. OLTP vs OLAP 4. COMPONENTES DEL SISTEMA 5. MODELO LÓGICO 6. TERMINOLOGÍA 7. HERRAMIENTAS 8. DIFERENTES ENFOQUES
Mistela And Tweets
1. SISTEMA OPERACIONALOLTP
Mistela And Tweets
1. SISTEMA OPERACIONAL Generalmente, la información que se quiere
investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas.
Muchas de estas fuentes son las que se utilizan para el trabajo transaccional diario (conocido como OLTP, On-Line Transactional Processing).
Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional).
Mistela And Tweets
1. SISTEMA OPERACIONALProblemas para realizar el análisis en este sistema (OLTP):
La información se encuentra en varias y heterogéneas bases de datos y, en consecuencia, no se puede explotar en conjunto.
Solo es posible el análisis de los datos actuales, no mantiene valores históricos para tratar evolutivos.
Se obstaculiza el trabajo transaccional diario de los sistemas de información originales, no permite el análisis on-line.
La base de datos está diseñada para el trabajo transaccional, no para el análisis de los datos.
Mistela And Tweets
2. DATAWAREHOUSEOLAP
Mistela And Tweets
2. DATAWAREHOUSE Motivación: Disponer de una base de
datos que permita extraer conocimiento de la información histórica almacenada en la organización.
Objetivos: Análisis de la organización Previsiones de evolución Diseño de estrategias
Mistela And Tweets
2. DATAWAREHOUSE Almacén de datos para el análisis y toma de
decisiones. Permite realizar análisis on-line, por lo que
aumenta el poder de toma de decisiones por parte de los responsables en cuestión
Unifica información dispersa de diversos sistemas operacionales
Contiene la información relevante de la organización
Diseños orientados a conceptos de negocio manejados por el usuario
Sistema OLAP (On-Line Analitical Procesing)
Mistela And Tweets
3. OLTP vs OLAP
Mistela And Tweets
3. OLTP vs OLAPOperacional (OLTP) Datawarehouse (OLAP)
• Almacén de datos actuales
• Almacena datos al detalle
• Bases de datos medianas
• Los datos son actuales• Los procesos son
repetitivos• Tiempo de respuesta
pequeño• Soporta decisiones
diarias
• Almacén de datos históricos
• Almacena datos al detalle y datos agregados a distintos niveles
• Bases de datos grandes• Los datos son estáticos• Los procesos no son
previsibles• Tiempo de respuesta
variable• Soporta decisiones
estratégicas.
Mistela And Tweets
4. COMPONENTES DE SISTEMA
Arquitectura técnica Aplicación usuario final
Fuentes externas
Datos transaccionales
Históricos
Niveles adicionales transformación
Niveles adicionalessumarización
Procesos de extracción Almacén de datos (DW) Presentación dela Información
ETL OLAP
Fu
en
tes d
e
Info
rmació
nU
su
ario
Mistela And Tweets
4. COMPONENTES DEL SISTEMAProcesos de extracción (ETL) Proceso de extracción y carga de la
información desde las distintas fuentes origen al Datawarehouse. Incluye las siguientes fases:1. Extracción: elaboración de interfaces entre
sistemas operacionales orígenes de datos2. Transformación: validación de los datos
extraídos, transformándolos al formato deseado3. Carga: cargar físicamente los datos extraídos de
los sistemas operacionales y ya transformados en el modelo de datos del Datawarehouse
Mistela And Tweets
4. COMPONENTES DEL SISTEMAAlmacén de datos (Datawarehouse) Se soporta sobre el modelo físico dimensional diferente
de los sistemas de bases de datos que están basados en el modelo Entidad-Relación (E/R). Este modelo contiene la misma información que el modelo E/R pero agrupa los datos con el objetivo de ganar una mayor comprensión para el usuario y garantizar la ejecución rápida y eficiente de las consultas.
Existen dos tecnologías para implementar dicho modelo: Multidimensional OLAP (MOLAP): se indexa los datos
directamente en un modelo multidimensional (cubos) en el cual todas las posibles combinaciones de los datos ya están calculadas en una celda
Relational OLAP (ROLAP): implementa las estructuras dimensionales mediante bases de datos con modelos relacionales.
Mistela And Tweets
4. COMPONENTES DEL SISTEMAPresentación de la información DSS (Decisión Support System):
Informes dinámicos, normalmente para representar un indicador o un grupo de indicadores relacionados funcionalmente en tablas de datos.
Además de estos informes predefinidos, los usuarios con capacidades de análisis podrán crear sus propios informes y obtener respuestas en demandas de información puntuales.
EIS (Executive Information System): Informes estáticos, predefinidos, fáciles de manejar y orientados a
los directores. Son informes muy visuales (normalmente se utilizan exclusivamente gráficos) y con un nivel alto de agregación de la información. Deben estar orientados a la gestión estratégica.
BSC (Balance Scored Card): Informes estáticos para la gestión estratégica de la empresa.
Permite medir el rendimiento de áreas o personas mediante el análisis de diversos de un conjunto de indicadores con valores objetivo y pesos.
Mistela And Tweets
4. COMPONENTES DEL SISTEMA
CRC
EISExecutive
InformationSystem
DSSDecision Support
System
Planificación operativa: Estructura, Actividad Asistencial,
RR.HH.,...
SIS
AL
SIP
SIA
/ D
MS
IA
CO
MP
AS
CIR
O
GA
IA
Otr
as A
plic
.
Cuadro de Mando Integral
Reporting de Excepción
Reporting Estándar
Nivel Aplicativo Transaccional
Alta Dirección
Analistas
Información de Gestión Operativa
Gestión Estratégica
Agr
egac
ión
de In
form
ació
n
Nav
egac
ión
en P
rofu
ndid
ad
Gestión Operacional
CRC
EISExecutive
InformationSystem
DSSDecision Support
System
Planificación operativa: Estructura, Actividad Asistencial,
RR.HH.,...
SIS
AL
SIP
SIA
/ D
MS
IA
CO
MP
AS
CIR
O
GA
IA
Otr
as A
plic
.
Cuadro de Mando Integral
Reporting de Excepción
Reporting Estándar
Nivel Aplicativo Transaccional
Alta Dirección
Analistas
Información de Gestión Operativa
Gestión Estratégica
Agr
egac
ión
de In
form
ació
n
Nav
egac
ión
en P
rofu
ndid
ad
Gestión Operacional
Mistela And Tweets
5. MODELO LÓGICOEJEMPLO
Mistela And Tweets
5. MODELO LÓGICOEjemplo
Organización: Cadena de supermercados.
Actividad objeto de análisis: ventas de productos.
Información registrada sobre una venta:“del producto “X” se han vendido en el almacén “nro.1” el día 17/2/2008, 5 unidades por un importe de 100 euros.”
Mistela And Tweets
Vent
as
importe
unidades
Alm
acén
Almacén
Ciudad
Región
Tipo
Pro
duct
o
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
Tie
mpo
Día
Mes
Semana
Año
Trimestre
Mistela And Tweets
Vent
asimporte
unidades
Departamento
Nro_producto
Categoría
Marca
TipoDía
Mes
Semana
Almacén
Ciudad
Región
Tipo
Año
Descripción
Actividad que es objeto de análisis con los indicadores que interesa analizar
Dimensiones (puntos de vista) desde los que se puede analizar la actividad.
Pro
duct
o
Tie
mpo
Alm
acén
Trimestre
Mistela And Tweets
5. MODELO LÓGICOModelo multidimensional en un esquema multidimensional se
representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones).
la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores.
la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
Mistela And Tweets
5. MODELO LÓGICO
departamento
almacén
ciudad región
tipo
día mes año
Producto
Almacén
Tiempo
nro. producto categoría
trimestre
semana
Entre los atributos de una dimensión se definen jerarquías
Mistela And Tweets
6. TERMINOLOGÍA
Mistela And Tweets
6. TERMINOLOGÍA Hecho
Un hecho es un elemento de información del negocio. Es decir, es un elemento que se puede medir
Indicador Fórmula matemática aplicada a un conjunto de
hechos Dimensión/Eje de análisis
Una dimensión es el aspecto o perspectiva mediante las cuales se pueden acceder a los hechos
Atributo Característica de una dimensión
Jerarquía Una jerarquía es la relación padre/hijo en la cual se
agrupan los atributos de una dimensión
Mistela And Tweets
6. TERMINOLOGÍA Agregación
Método por el cual los datos, son agrupados para realizar una tabla de hechos específica
Sumarización Método por el cual los datos se cambian de nivel de
granularidad Desnormalización
Introducir redundancias de la información en las tablas de la base de datos para mejorar el rendimiento de la aplicación
Datamart Un Datamart, al igual que un Datawarehouse, es un
almacén de datos para el análisis y toma de decisiones. La diferencia esta en el contenido, ya que un Datamart es un subconjunto departamental de un Datawarehouse corporativo o un Datawarehose de un solo sistema funcional.
Mistela And Tweets
6. TERMINOLOGÍA Drill down / up
Navegar dentro de la información, desde niveles mas altos a niveles mas bajos o viceversa
DataMining Búsqueda de patrones de comportamiento, dentro de datos,
ya sea de un Datawarehouse, o cualquier otra fuente de información
EIS (Executive Information System) Sistema estático orientado a los ejecutivos, con informes
predefinidos y fácil de manejar DSS (Decision Support System)
Sistema de ayuda a la decisión con la libertad de poder realizar consultas e informes libres sobre la información
BSC (Balance Scored Card): Sistema estático para la gestión estratégica de la empresa
Mistela And Tweets
7. BUSSINES INTELLIGENT
Mistela And Tweets
7. BUSSINES INTELLIGENCE Business Intelligence suele definirse como la
transformación de los datos de la compañía en conocimiento para obtener una ventaja competitiva.
Desde un punto de vista más pragmático, y asociándolo directamente a las tecnologías de la información, podemos definir Business Intelligence como: el conjunto de metodologías, aplicaciones y tecnologías que
permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa (reporting, análisis OLAP...) o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.
Mistela And Tweets
Mistela And Tweets
8. HERRAMIENTAS
8. HERRAMIENTAS IBM InfoSphere DataStage SW ETL de IBM para plataformas distribuidas y
mainframes IBM Cognos DecisionStream
Software ETL de IBM para la construcción de Data Warehouses y Data Marts para reporting y análisis
IBM InfoSphere Change Data Capture (CDC)Software de IBM para la integración de información en tiempo real a través de almacenes de datos heterogeneos.
Informatica PowercenterSoftware de Integracion de datos empresariales de Informatica
Oracle Data Integrator (ODI)Plataforma de integración de datos de Oracle Fusion Middleware
Oracle GoldenGate (CDC)Sofware de integración de datos de Oracle Fusion Middleware, que permite la replicación de datos en tiempo real en entornos de datos heterogéneos
8. HERRAMIENTAS SAP BusinessObjects Data Integrator
Software ETL de SAP BO, plataforma de Business Intelligence de SAP SAS Enterprise Data Integration Server
Software de ETL y ELT de SAS, que permite transformar datos directamente en las bases de datos origen
Microsoft SQL Server Integration Services (SSIS)Software ETL de Microsoft, incluído en la base de datos SQL Server, y que reemplaza a Data Transformation Services (DTS)
iWay DataMigratorHerramienta ETL de iWay Software para Data Warehousing.
iWay Enterprise Information (EII)Herramienta ETL de iWay Software para integración en tiempo real entre almacenes de datos heterogéneos.
Open Source: Google Refine Pentaho Data Integration (PDI)
Software ETL Open Source de la suite de BI de Pentaho. La versión Community (PDI CE) es tembién conocida como Kettle, que es el nombre del proyecto open source original.
Talend Open Studio for Data IntegrationSoftware ETL Open Source para integración de datos de Talend.
9. ENFOQUES
9. ENFOQUES La solución Business Intelligence abarca tanto la
modelización y almacenamiento de los datos, como la explotación de los mismos, para extraer la máxima información y conocimiento.
Sistemas sanitarios Sistemas bancarios Sistemas gestión de productos (almacenes) A nivel pequeño, puede servir para predecir:
Costes, recursos necesarios para una tarea/s, tiempo medio de implementación, según tipo de proyecto tiempo estimado de desarrollo, diseño…millones de aspectos se pueden predecir.
¡GRACIAS!