Integrantes:
Aguilar Palacios Lizbeth
Rivera Ochoa Julieta Farina
Romero Velázquez Yoreli
Visión General del Ejecutivo
Integración de datos es la primera forma de integración. La información de la empresa
se consolidó en forma de almacenes de datos, los datamarts, y almacenes de datos
operacionales.
Integración de datos ha madurado de manera espectacular en los últimos años, en el
pasado fue un punto a punto solución, estrictamente centradas sobre el traslado de
bloques de información de un sistema a otro. Con el movimiento en tiempo real,
haciendo hincapié en la importancia de los metadatos y la necesidad de integrar todas
las formas de contenido, nos encontramos con que la integración de datos es un
subconjunto de la mayor área de integración de la información.
Integración de la información incluye tanto datos estructurados y la información no
estructurada como documentos, gráficos de medios de comunicación.
Visión General del Ejecutivo
Un sitio web puede agregar los datos de múltiples bases de datos y
sincronizar los cambios a todos ellos, así como en la actualidad otros
tipos de datos no estructurados, tales como gráficos y audio.
El problema con cada una de estas soluciones es la necesidad de
mover físicamente grandes volúmenes de datos procedentes de
sistemas de fuente de múltiples datos consolidados como a los datos
almacenados almacén, datos distribuidos, almacenes de datos
operativos, bases de datos y de análisis multidimensional.
Visión General del Ejecutivo
La Empresa de Integración de Aplicación (EAI) resolvió el problema de
latencia en la sincronización de los cambios a través de sistemas en tiempo
real, pero menos adecuada a las necesidades y la consolidación de la
agregación de datos y la información en toda la empresa.
Los mapas de datos de EAI permiten intercambios de datos entre sistemas,
pero no se define una vista agregada de los datos objeto o entidades
comerciales.
Visión General del Ejecutivo
La Empresa de integración de la información (Ell) es a la vez una antigua y
la nueva idea que proporciona los datos agregados de las antiguas
capacidades de herramientas ETL, proporciona acceso en tiempo real a
información precisa,
También proporciona una infraestructura de gestión de datos integrada de
la empresa.
La otra inevitable necesidad de integrar y gestionar información no
estructurada. Documentos, correos electrónicos, gráficos, multimedia, y
otros tipos de datos electrónicos podrían incluirse en aplicaciones Web.
Visión General del Ejecutivo
La Gestión de contenidos empresariales (ECM) proporciona estas
capacidades. ECM sistemas también pueden ofrecer algunas
aplicaciones de integración y capacidades de flujo de trabajo,
redundante prestación de estos servicios de integración también
proporcionada otras tecnologías en la infraestructura.
Si bien muchas de las grandes organizaciones requieren de ECM EAI y
EII, hay poca integración a través de estas tecnologías hoy en día.
Escenarios de Integración de InformaciónEste capítulo se centra en tecnologías y arquitecturas de la aplicación de las aplicaciones
construidas a una empresa de integración de la información infraestructura.
Integración de la información puede ser utilizada para implementar los siguientes tipos de
aplicaciones:
Creación de una vista única de un cliente o de otra entidad empresarial.
Datos de la empresa y la gestión de inventario.
En tiempo real la información y el análisis, la gestión y la creación de paneles.
Actualización de un almacén de datos.
Creación de un almacén de datos virtual.
Actualización de información común a través de fuentes de información.
Escenarios de Integración de Información Creación de aplicaciones de portal que contiene tanto
los datos estructurados y no estructurados de diferentes
sistemas.
Integración de datos no estructurados, como documentos,
audio, vídeo y otros medios electrónicos, en las aplicaciones.
Proporcionar una infraestructura de gestión de la
información en favor de la empresa, incluidas todas las
formas de los medios digitales.
Escenarios de Integración de Información
Información de la integración simplifica la creación de todas estas
aplicaciones, permitiendo la información para que pueda ser visitada y
gestionarse como si viniera de una única fuente de datos.
La integración de la información tiene ventajas tácticas para proporcionar
una manera rápida y fácil de acceder a las fuentes de datos, el beneficio
estratégico es el papel que puede desempeñar en la gestión de datos a
largo plazo. Un informe de investigación indica que los costos de
administración de base de datos ahora dominan el coste total de propiedad
de las solicitudes por debajo de los 500 niveles de usuario, y que seguirá
aumentando en importancia para la aplicación de todos los tamaños.
Selección de Integración de Tecnología de la Información
Integración de la información es un mercado emergente del
sector. Actualmente, las principales categorías de la
tecnología de integración de la información se reparten entre
la estructura y los datos no estructurados. Extraer,
transformar y carga herramientas de uno es el método más
popular de la integración para la sincronización de datos.
Selección de Integración de Tecnología de la Información
ETL y EII se centran en la integración de datos estructurados. La diferencia
es que ETL es una herramienta orientada a lote y EII es tiempo real.
ECM proporciona gestión e integración de información no estructurada que
figuran en los documentos, audio, vídeo y archivos gráficos.
Mientras tanto EII o ECM puede resolver sus necesidades de integración
de la información actual, en el futuro, el contenido gestionado por estas
diferentes tecnologías podrían tener que ser integrados en las aplicaciones
de medios enriquecidos.
Selección de Integración de Tecnología de la Información
Actualmente, la mayor parte de estas tecnologías no son diferentes de integración y
que cada uno proporciona redundancia y la superposición de servicios, incluidos los
adaptadores de aplicación y los repositorios de metadatos. Si bien la elección actual de
la tecnología hace que sea imposible evitar la redundancia, un repositorio de
metadatos de la empresa pasará a lo largo de manera rápida lo que permite la
integración de la información en el futuro.
Las empresas debe comenzar la captura de metadatos acerca de las soluciones
integradas en un formato común por lo que esta información se puede aprovechar y
reutilizar en el futuro. Dejando de esta información en herramientas de mapeo de datos
de propiedad limita la agilidad de negocio.
ETL
Herramientas ETL están ampliamente disponibles, aunque no existen.
Cada producto tiene un ambiente diferente en el que sobresale, la
mayoría debe cumplir muy bien con las modernas bases de datos
relacionales, existen diferencias muy reales en lo que respecta a los
productos en que los sistemas que apoyen en un entorno mainframe. p
Además, la integración con las aplicaciones empaquetadas serán
diferentes entre las ofertas. Las herramientas ETL tienden a ser
independiente y orientado a los lotes, y se centran en el almacén de
datos de mercado.
EII
La EII es sólo un mercado emergente. El foco de las
herramientas en este mercado es el acceso a la información en
tiempo real a través de múltiples sistemas de información.
El corazón de estas soluciones es un repositorio de metadatos
que contiene las definiciones de datos para todos los sistemas
existentes, así como los mecanismos de acceso para recuperar
la información. En la mayoría de los casos, estas son las
entregas en un solo sentido de la información. Sin embargo, las
nuevas implementaciones son las dos vías de integración.
EIIOtra característica de una herramienta EII es la agregación de datos de
servicio que permite a las nuevas estructuras de datos crearse a partir de
las estructuras existentes. El linaje de datos del impacto de informes y
permite que el sistema para garantizar que los cambios que pueden
evaluarse y gestionarse a los sistemas existentes.
XML y servicios Web se están convirtiendo rápidamente en las normas en
que se basan estos productos. El Caso de Estudio 11.1 analiza el caso de
CompuCredit para examinar los beneficios empresariales de un enfoque
EII (CIO Magazine, 2003).
Caso de Estudio 11. 1 CompuCredtt: Creación de una Empresa de Arquitectura de Datos
En el Caso de Estudio 3.1 en que presentó CompuCredit para ilustrar una organización que ejecuta una
estrategia para hacer que la información esté más fácilmente disponible para sus usuarios a reducir el
análisis de tiempo de meses a semanas. La estrategia de integración se basa en un patrón de diseño
que combina la integración de datos con un repositorio de metadatos de la empresa (EMR). Las normas
son un elemento clave para la selección de un socio.
XML y servicios web son un factor crítico en la arquitectura y el diseño. La integración de datos EMR, y
las normas fueron combinadas para formar CompuCredlt XML Gateway. La puerta de enlace XML
proporcionado un acceso transparente a la diversidad interna y externa de fuentes de datos y
aplicaciones que son necesarias para reducir el tiempo y el esfuerzo para adquirir y gestionar el cobro
de tarjetas de crédito carteras que están en el corazón de la empresa.
Una estrategia de integración de la información más relevante fue el enfoque arquitectónico, dada la
necesidad de proporcionar información en tiempo real de múltiples fuentes en una visión integrada para
los usuarios y las aplicaciones de usuario.
ECM
La mayoría de las organizaciones gastan su dinero en la gestión de su
información estructurada, mientras que la gran cantidad de su información no
estructurada es almacenada en discos duros de las computadoras sin ningún tipo
de mecanismo para encontrar esta información y la reutilización. El mercado de
ECM se orienta a proporcionar soluciones para resolver este problema. No hay
ningún producto aceptable común o las normas bajo las cuales estas se
desarrollan.
Las arquitecturas suelen utilizar la misma solicitud de integración de componentes
de acceso a la información en diferentes plataformas y sistemas. El Caso de
Estudio 11.2 examina cómo el Estado de Dakota del Norte aplican un enfoque de
ECM para ayudar a sus legislar (Software AG n.d.).
Caso de Estudio 11.2Estado de Dakota del Norte: La sustitución de los volúmenes de papel con la instantánea, el acceso en línea a Bill información
La Legislatura del Estado de Dakota del Norte se reúne cada dos años para aprobar o modificar cientos de
proyectos de ley en un período de sesiones de 80 días. Este es un papel intenso, donde tradicionalmente un
legislador habría un período de dos pies de largo de la carpeta de rodadura de ley libros, con resmas de información
adicional en la oficina. El acceso central de a los proyectos de ley que estaba disponible, pero no resulta práctico
para muchos miembros del personal.
Su contenido es proporcionado a los mismos de una manera integrada con características adicionales, como el
calendario y el correo electrónico, así como otros contenidos de sistemas heredados, como el período de sesiones y
horarios de audiencia de las comparaciones, las transcripciones de las llamadas telefónicas constituyente, y las
votaciones nominales de cada cámara.
Una estrategia de integración de información basada en un modelo de gestión de contenidos empresariales es el
enfoque arquitectónico más relevante dada la necesidad de proporcionar información estructurada y no estructurada
en tiempo real de múltiples fuentes en una visión integrada para los usuarios y las aplicaciones de usuario.
Especificación de la Aplicación de Integración de Información Introducción
Esta especificación proporciona orientaciones para la
aplicación para el desarrollo de una solución basada en la
integración de la información.
Esta sección describe los problemas técnicos específicos
que se están abordando en el contexto de dar aplicación a
la aplicación concreta.
Especificación de la Aplicación de Integración de Información
Ámbito de Aplicación
El ámbito de aplicación de una especificación de Integración
de Información se limita a la especificación de la información
y sistemas que se están integrando. Debe referirse a las
organizaciones, la información, sistemas, y el resultado final
esperado.
Especificación de la Aplicación de Integración de Información
Principales Participantes
Esta sección identifica todas las partes interesadas en la
aplicación, incluidos los directivos de las empresas que
controlan la totalidad o parte de los sistemas,
administradores de datos o los responsables de la calidad
de los datos, diseñadores de sistemas y arquitecto (s), y el
equipo de desarrollo que ejecutará la aplicación. Todos los
demás participantes o interesados también deben ser
identificados, entre ellos sus funciones.
Especificación de la Aplicación de Integración de Información
Patrones de Integración de Información y Servicios
Hay varios patrones básicos de aplicación para la solución de integración
de la información. Estos patrones son la integración de la información:
Integración de Datos.
Integración de contenido no estructurado.
Repositorio de Metadatos de Integración.
En esta sección se definen el patrón que se utiliza y proporciona detalles
sobre la configuración de los componentes específicos de la aplicación.
Especificación de la Aplicación de Integración de Información
Integración de Datos
Implica la integración de datos estructurados de
datos, generalmente se encuentran en diferentes
bases de datos en toda la organización. Como se ha
indicado anteriormente, las soluciones ETL han dado
lugar a tiempo real de integración de información
empresarial (EII).
La Arquitectura de Integración de Datos de Referencia (Figura 11-1) muestra
los servicios opcionales y para la integración de datos.
El servicio de consulta representa la posibilidad de acceder a diferentes
fuentes de datos como si se tratara de una única base de datos (incluyendo la
capacidad de hacer una sola llamada a través de bases de datos SQL) y el
apoyo en tiempo real y consolidado de consultas de datos federadas.
La indexación y almacenamiento en caché representa los métodos que
permitan a las preguntas rápidas en tiempo real. Las opiniones representan la
capacidad de crear diferentes vistas virtuales de la información consolidada
para simplificar el acceso y apoyo a los usuarios o aplicaciones específicas.
EI repositorio de metadatos almacena toda la información pertinente
acerca de los objetos de datos. Traducción y transformación de datos
es necesaria para la información del mapa en la cuenta de ver y hacer
cambios a las fuentes. Limpieza de datos, a menudo parte de un
almacén de datos, es muy importante para mantener la exactitud de la
integración de datos.
La replicación y sincronización de datos ha estado disponible para los
proveedores de la base de datos de un tiempo, y es un servicio muy
útil para la integración de datos. La capa de acceso a la fuente de
datos incluye los adaptadores de aplicación y la base de datos, tales
como puertas de enlace ODBC y JDBC.
Oracle C / S Aplicación
Plataforma Unix
DB2 Aplicación legado
OS390
SQL Server
DataMart
Wintel
SAP
Data
Informix
Data Warehouse
FUENTE DE DATOS DE ACCESO
SEGURIDAD
Replicación/
Sincronización
Data Cleasing Gestión de Transaccuón
Transacción / Transformación
Repositorio De
Metadatos
Vistas
Indexing
Cacheing
Consulta
Figura 11-1 Arquitectura de Integración de Datos de Referencia
Tabla de Aplicación (Figura 11-2, página 224) se especifican todos los servicios de integración en la Arquitectura de
Integración de Información, junto con los detalles de implementación.
Servicio de Integración Vendedor / Producto Notas de la Implementación
Herramienta de integración de datos < Nombre del vendedor /
Nombre del producto >
< Módulos desplegados, el método, (PP virtual, del segmento de
las fuentes de datos, indexación y recuperación) >
EII < Nombre del vendedor /
Nombre del producto >
<Módulos desplegados >
Traducción y la transformación < vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
Formatos soportados
Fuente de datos de acceso< vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
< ODBC, JDBC, SOAP, otros métodos de apoyo>
Repositorio de metadatos< vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
<Tecnología DBMS >
Consulta < vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
< Una responsabilidad de la empresa información consulta la red
como una sola fuente de datos. Definir lenguaje o método>
Vistas < vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
<Lista de vistas disponibles para simplificar el uso para
aplicaciones específicas o usuarios>
Servicio de Integración Vendedor / Producto Notas de la ImplementaciónLimpieza de Datos
< Nombre del Vendedor /
Nombre del Producto>
<Realizada por la herramienta >
Replicación / sincronización de datos< Nombre del Vendedor /
Nombre del Producto >
< Parte del DB o EII servidor>
Gestión de transacciones< vendedor de nombre / nombre de producto en caso
de ser diferente del vendedor EII >
<Definir o reducir la indemnización>
Seguridad <Vendedor nombre / nombre de producto en caso de 3
° Parte secutiry vendedor utilizados>
<Métodos y el nivel de seguridad que ofrece>
Integración de Contenido No Estructurado Si bien la integración de datos proporciona acceso integrado a información en bases de
datos, hay una gran cantidad de datos no estructurados que todos tiene que ser integrada
con portales web y aplicaciones, incluidos documentos, imágenes, fotos, audio, vídeo y otros
medios digitales. Esta información no estructurada exige la misma capacidad de gestión y
consulta de información estructurada como la gestión y la integración.
El Servicios prestados por las soluciones de ECM (Figura 11 -3, página 225) incluye tienda
repositorio, de búsqueda (consulta) la capacidad, control de versiones (check-in / out), la
replicación de los cambios en los contenidos, la integración, el contenido de la prestación
(traducción / transformación), la seguridad, la gestión de procesos, y la entrega de contenido.
La futura dirección es tener tantos datos estructurados y no estructurados y gestionados a
través de una herramienta. Ell Algunos proveedores ya ofrecen.
Documentos Archivos de Audio Archivos de Video Fotos / Gráficos Especificaciones de Diseño
ÍNDICE DE GESTIÓN DE CONSERVACIÓN
Renderizado / Traducción
Replicación
Repositorio de Metadatos
Contenedor / Vista
Consulta
SEGURIDAD
GESTIÓN DE PROCESOS
Figura 11-3 Información no estructurada Arquitectura de Referencia
El cuadro de información no estructurada (Figura 11-4, página 226)
Detalles de la aplicación. Todos los servicios pueden provenir de un único
proveedor de ECM, o de una combinación de proveedores.
Proveedores de ECM suelen tener múltiples módulos y capacidades que
pueden ser desplegadas con flexibilidad, de modo que incluso cuando se
utiliza un único proveedor, es útil para especificar los servicios o módulos
de aplicación.
Integración de Servicios Vendedor / Producto Notas de Implementación
ECM <Nombre del Vendedor / Nombre del Producto>
< Módulos Desplegados>
Renderizado (traducción y transformación) <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Formatos, incluyendo HTML, MS Word, MS Excel, TIFF, JPEG>
Repositorio de contenidos <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Tipos de contenido apoyado incluidos documentos, imágenes, fotos, audio y vídeo>
Metadatos <Tipos de metadatos de apoyo incluyendo descripciones miniaturas, palabras clave, común de gestión de la información de metadatos>
Capacidades de consulta <Capacidad de consulta de los diferentes tipos de contenido con un método común; texto completo de consulta; texto escaneado consulta>
Objetos de Contenido / contenedores (vistas) <Definir el contenido de objetos que contienen otros objetos de contenido, por ejemplo página Web>
Contenido de propagación <Capacidad para propagar los cambios a través de una variedad de fuentes para asegurar el contenido se sincroniza>
Gestión de Procesos <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Módulos desplegados, incluyendo el modelado, la gestión de escritorio, etc>
Seguridad <Nombre del proveedor / nombre de producto en caso de 3 ° parte de proveedores de seguridad utilizados>
<Modelo y el nivel de seguridad que ofrece>
repositorios de metadatos de Integración
Repositorios de metadatos son a menudo parte de los EII y soluciones ECM. Sin embargo,
también se enumeran por separado aquí para llamar la atención sobre su importancia y al
hecho de que la información de metadatos común es una parte esencial de la integración de
infraestructura.
Un depósito de metadatos, es esencialmente una base de datos que contiene información
sobre fuentes de datos (véase el Capítulo 8 para obtener más información acerca de los
metadatos). Lamentablemente, gran parte la integración de metadatos está enterrado en las
herramientas de propiedad.
Con el fin de maximizar la reutilización y el negocio y la agilidad, los metadatos deben ser
administrados constantemente empresa como un valioso recurso.
Repositorio de metadatos de la empresa contiene todos los
metadatos de la información y la aplicación de fuentes. Una
contiene el repositorio de metadatos de mecanismos de acceso
también. El repositorio de metadatos también contiene nuevas
descripciones de metadatos, como el formato canónico, que
pueden asignarse a la fuente de los metadatos, ya sea
directamente o transformación o la aplicación de normas de
cálculo.
Adaptadores de integración u otras tecnologías, incluida la base
de datos y portales de servicios Web entrelaza, se utilizan para
conectarse a las fuentes existentes.
Porque Ell y soluciones ECM podría tener cada uno sus propios metadatos
repositorios, una empresa podría cerrar con múltiples repositorios para la gestión,
y los metadatos que necesita ser integrada y sincronizada.
En principio, el depósito de metadatos, debe proporcionar un nivel de abstracción
que hace que sea más fácil de consolidar, integrar y administrar información
distribuida. En la práctica, la empresa puede crear una necesidad de varios
niveles de arquitectura de metadatos para proporcionar los niveles de abstracción
necesarios para prestar esta agilidad.
El diagrama de la arquitectura y la especificación de mesa deben incluir todos los
metadatos fuentes. Figura 11-5 (página 228) muestra cómo un depósito de
metadatos, la empresa trabajará con EII y de soluciones ECM para facilitar el
acceso a diferentes tipos de información empresarial..
Fuente de Datos Archivos de Audio Archivos de Video Fotos / GráficosEspecificaciones de
Diseño
Acceso a Datos
Documentos
Acceso a Contenido No Estructurado
SEGURIDAD
Sistema de Integración Empresarial
Sistema de Gestión de Contenido Empresarial
Repositorio de Metadatos Empresarial
Consulta
Figura 11-5 Repositorio de metadatos de referencia Arquitectura
El repositorio de metadatos de aplicación el cuadro (Figura 11a-6o, página 229) define los servicios esenciales de apoyo en tiempo real de acceso a datos distribuidos
Integración de Servicios Vendedor / Producto Notas de la Implementación
Repositorio de Metadatos <Nombre del Vendedor / Nombre del Producto>
<Tipos de contenido apoyado incluidos documentos, imágenes, fotos, audio y vídeo>
Formato Adecuado <XML, de propiedad, otros>Traducción y transformación / formato de la prestación
<Nombre del Vendedor / Nombre del Producto>
<Formato, incluyendo XML, otros formatos de datos, HTML, PDF, MS Word, MS Excel, TIPP, JPEG>
Capacidades de consulta <Idioma (s) Soportados> <SQL; palabra clave de búsqueda, texto completo de consulta, otros>
Capacidades de acceso <Nombre del Vendedor / Nombre del Producto>
<Puerta de enlace, o API de la base de datos, otros>
Réplica <Nombre del Vendedor / Nombre del Producto>
<Mecanismo para la sincronización de los cambios a través de fuentes>
Seguridad <Nombre del proveedor / nombre de producto en caso de 3 ° parte de proveedores de seguridad utilizados>
<Modelo y el nivel de seguridad que ofrece>
Figura 11-6 Tabla de Implementación del Repositorio de Metadatos.
Buenas Prácticas en la Integración de Información
Crear un EMR. Crear un repositorio de metadatos de la empresa que proporciona
información sobre los diferentes tipos de fuentes de información empresarial.
Organizar un "centro de excelencia". Crear una empresa de integración de competencias
centro. La creación de los metadatos repositorio incremental, un proyecto por proyecto,
funcionará bien siempre y cuando un grupo de gestión centralizada de forma
superposiciones e incoherencias pueden ser rápidamente identificados y resueltos.
Centrarse en la calidad de los datos. Nombrar a los delegados sindicales la información que
son responsables de la calidad de los datos en sistemas de código. La información de
monitores también son responsables de participar en el diseño de evaluación y garantizar el
significado semántico de los datos está asignada correctamente al formato canónico.
Identificar las "normas de oro" para los datos. Crear una empresa
de arquitectura de la información que incluye información sobre las
fuentes de registro (autorizada, fuentes de datos) para cada
entidad de negocios que debe ser coherente en toda la empresa.
Garantizar la existencia de pruebas se logra. Crear un plan de
prueba para asegurarse de que las consultas a una vista de datos
consolidada volverán respuestas correctas.