Establecer la conexin con las herramientas de Integracin de
datos de Pentaho.OBJETIVOEstablecer un flujo de datos entre dos
bases de datos.QUE SE REALIZAR EN ESTA ETAPA.La comunicacin
requiere un emisor, un receptor, un canal y un mensaje, basado en
eso, estableceremos una comunicacin entre 2 bases de datos usando
una herramienta de Acceso Manejo de ETL llamada Spoon de la suite
de pentaho, y enviaremos como mensaje el contenido de una tabla.
Web Project serverRepositorio de datos
INSTALACIN. La versin comunity edition pentaho no requiere
instalacin, simplemente se descomprime, el archivo que actualmente
corresponde a la ltima versin es:pdi-ce-4.4.0-stable.zipSe puede
descargar
desde:http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.4.0-stable/Es
posible que el driver que permite la conexin de Pentaho a Mysql no
est y sea necesario adicionarlo, se soluciona ubicando el archivo
mysql-connector-java-5.1.23-bin.jar en la carpeta
data-integration\libext\JDBC.(el archivo
mysql-connector-java-5.1.23-bin.jar est junto a este documento en
el mismo zip ).
Es necesario verificar que tengan una versin de java instalado
en su computador, pueden descargarlo
de:http://www.oracle.com/technetwork/java/javase/downloads/jre-6u25-download-346243.html
EJECUCIN.
Lo primero que realizamos es componer un flujo de datos, esto se
hace por medio de la herramienta Spoon.Se ejecuta por medio de
Spoon.bat
Si solicita Acceso a usuario y contrasea a un repositorio, no es
necesario. Oprimir cancelar
INICIO DE LA HERRAMINETA.La ventana inicial nos presenta un men
de opcines, por ahora ver en File > New -> transformacinEsto
nos lleva a una ventana donde podemos inicial un proceso ETL.
En el costado izquierdo estn las herramientas.Al lado derecho
estas se arrastran, colocan de acuerdo a su utilidad.
UBICAR COMPONENTES DE LA ETLPara obtener informacin de nuestro
origen de datos, iniciamos con la opcin Table Input y lo ponemos
arrastramos al rea de trabajo.
Con doble click abrimos el men que dispone de varias opciones1.
Nombre del paso.2. Conexin a usar 3. Consulta que se requiere
realizar.4. Opciones de desempeo como limitar nmero de columnas,
entre otras.
DEFINIR LA CONEXIN A LA BASE DE DATOS ORIGEN
click en New.. y llegamos a la siguiente ventana que se llena
como se v a continuacin.
Se llenan los campos con esta informacin:
Connection Name: poliConnection Type: MySQLAccess:
Native(JDBC)Host Name:
polienero2014.cuit8lfnw4w1.us-east-1.rds.amazonaws.comDatabase
Name: sakilaPort Number: 3306UserName: poliEnero2014Password:
poliEnero2014
Si est bien al hacer click en Test aparece algo parecido a:
Aceptamos el ok del test de la conexin Ok en la
conexin.Regresamos a la ventana Donde definimos las caractersticas
de la consulta de cual deseamos extraer informacin.
DEFINICIN DE LA CONSULTA AL SISTEMA ORIGEN
Ahora podemos visualizar el contenido de la base de datos
haciendo click en Get SQL select StatmentY luego de cargar podemos
navegar en la estructura de tablas de la base de datos. Si
seleccionamos la tabla contactos, y luego click en OK. El sistema
automticamente construye una consulta con todos los campos de la
tabla.
Podemos limitar o editar la consulta que realiza el sistema
desde esa caja de dialogo.
Damos OKDEFINICIN DEL DESTINO DE LA INFORMACIN
Adicionamos una conexin Output lugar donde dejaremos los datos
de las tablas:
En Access Previamente creamos una base de datos con una
tabla
.. se hace doble click en el icono de conexin de Microsoft
Access Output.Y despliega una ventana donde se puede realizar la
conexin. Click en OK
EJECUCIN DEL PROCESO ETLEn la parte superior hay una barra de
herramientas que nos permiten hacer la ejecucin del ETL ahora
construido.
CLick en el botn verde Play : Emerge una ventana de parmetros de
la configuracin(en casos particulares se adicionan parmetros, en
este caso no)
Se ejecuta la transformacin por medio del botn Launch y luego se
acepta la ejecucin.
El resultado de la operacin es exitoso.(ntese que en la parte
superior de cada conexin hay un signo que indica correcto)
(En caso de error aparecen lneas rojas indicando en donde falla
el proceso.)
VER EL RESULTADO
Se actualiza la tabla en Access y como resultado obtenemos la
migracin de la informacin.
Se ha cumplido el objetivo. Se ha llevado informacin de un
sistema a otro.En este ejemplo la transformacin es pequea, y se
entiende como un filtro de registros (ya que no se estn realizando
operaciones complejas sobre estos).
Entrega del trabajo1. Documento de office con la captura de las
pantallas de los procesos que realizaron, incluyendo el de ejecucin
exitosa del proceso2. Adjunto archivo con extencin .ktr que
contiene el ejercicio realizado.