Top Banner
Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust Juan Vicente Herrera @jvicenteherrera Joaquin Díez Gómez @joaquindiez
31

Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Apr 16, 2017

Download

Data & Analytics

Joaquin Diez
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Juan Vicente Herrera @jvicenteherrera Joaquin Díez Gómez @joaquindiez

Page 2: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust
Page 3: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

BIG DATA en Tiempo Real

Page 4: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

¿Por qué BIG DATA?

Page 5: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

All data that is not a fit for a traditional RDBMS, whether used for OLTP or Analytics purposes

@eddie_satterly - Splunk

Page 6: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Eventos

Page 7: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust
Page 8: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust
Page 9: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust
Page 10: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

BIG DATA en Tiempo Real

Page 11: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Casos de Uso

Page 12: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

• Devops

• Desarrolladores: detección de errores, análisis de uso de sus aplicaciones (Web, Apps)

• Analíticas en Tiempo Real (User & Business)

• Detección de anomalías, análisis de tendencias.

Page 13: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

• CAPTURAMOS DATOS (Eventos)

• ALMACENAMOS

• EXTRAER SU VALOR POTENCIAL

SIMPLIFICANDO

Page 14: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

¿por que no usar una Base de datos normal?

• cuando se tiene un martillo todos los problemas son clavos.

• ACID compromete los limites escalabilidad y rendimiento de los sistemas

• No todos los datos necesitan almacenamientos ACID

• NO ESCALAN

EL PROBLEMA

RDBMS

Page 15: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

• 10 servidores

• 8640 eventos por dia ( 1 cada 10 segundos)

• 365 dias

• = 31.536.000 eventos en 1 año

Page 16: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Big Data Technologies (2011-)

Bases de Datos Relacionales (muy estructurados)

Sistemas de Archivos Distribuidos (semi-estructurados)

Clave/Valor, Columnares y otros (semi-estructurados)

MongoDB

NOSQL

Cassandra

CouchDB

RDBMS Sharing

HDFS Storage

Map / Reduce

Page 17: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Vamos a desarrollar nuestra propia tecnología !!!!!!

Page 18: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

- Almacenar Datos con y sin estructura - Almacenarlos en su formato Original - Escalable - Tolerante a Fallos - Muy eficiente en escritura y en lectura - Escalabilidad lineal en el rendimiento - Sin degradación del rendimiento según se incrementa el volumen de datos. - Procesar información en Tiempo Real - Un Lenguaje común: SQL

OBJETIVO

Page 19: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

19

100.000 EPS Escritura por core (1 hebra)1.000.000 EPS Lectura por core = 1 Query 2M EPS

Ubuntu Linux 8 cores

30GB Memoria 2TB disco

EL DATANODO

Alcohol

Malote Malote

51.000 Millones de Eventos (512 bytes)

Page 20: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

¿Como se consigue esa velocidad?

• Eliminando TODO lo que no necesitamos

• No Es ACID

• Solo se implementa Escritura y Lectura de Datos

• Compresión de los datos en crudo. Ratio 12:1

20

Page 21: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

21

Escritura 100.000 *8 = 800.000 EPS

Batrasio

MetaMalote

Page 22: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

22

Escritura 100.000 *30 = 3.000.000 EPS

60TB = 1.5 Billones de Eventos

30 datanodos

Consulta 1M *60 = 60.000.000 EPS

Page 23: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

SQL

23

Cluster de Almacenamiento

Motor de Correlación

Motor de Alertas

SQL

Motor de Agregación

SQL

Web App, Busqueda Dashboards, Reporting, Aplicaciones

VerticalesSQ

LAPI

RESTEmail

JIRA

PushOver

PagerDuty

HTTP/JSON

MySql

Page 24: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Integración contínua• Hace no mucho…

• Integración contínua a medias. Test pero no automatizados ni despliegues automáticos

• Despliegues manuales mediante scripts que no cubrían todo el despliegue

• Sin gestión de configuración (manual)

• Control de versiones mediante git

24

Page 25: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Ansible al rescate• Despliegues mediante Ansible

• Gestión de la configuración mediante Ansible

• Cifrado mediante Ansible-vault

• Despliegues contínuos (Gitlab + Jenkins + Ansible)

• Notificaciones de jobs Jenkins mediante Slack (Mucho por mejorar aún)

• Migración a GitLab (Mejor gestión de permisos)

• Test seguimos mejorándolos: Hemos fichado al primer QA!

25

Page 26: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Infraestructura/Stack• Agnósticos al proveedor gracias a:

• Ansible (SSH)

• Stack opensource (Ubuntu, Java,NodeJs,Tomcat, Nginx, HAproxy, MongoDB, MySQL, RabbitMQ…)

26

Page 27: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Proveedores actuales• AWS

• Azure

• VDC (Teléfonica)

• VmWare

• Bare metal

27

Page 28: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Tipo de instalaciones

• OnPremise (Cloud y bare metal). Grandes clientes solo.

• Híbridos (Cloud y bare metal): Datos en servidor cliente.

• SAS: Solo agente y datos a nuestra nube.

28

Page 29: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

Demo Time

29

Page 30: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

30

Page 31: Big Data de verdad, en 4K y en tiempo real; Arquitectura Logtrust

https://www.logtrust.com/en/category/jobs/