Dell EMC Ready Solutions for AI: Aprendizaje profundo con ... · artificial (IA) y los nuevos algoritmos, el aprendizaje automático (ML) y el aprendizaje profundo (DL) han pasado
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Aprendizaje profundo con Intel .................................................................................................................................... 4
Validación técnica de ESG ................................................................................................................................................. 5
Aceleración del desarrollo de modelos de IA ............................................................................................................... 5
Qué significan los números ....................................................................................................................................... 6
Escalamiento de la infraestructura ............................................................................................................................ 6
Qué significan los números ....................................................................................................................................... 7
Mejora del TCO del programa de la IA .......................................................................................................................... 9
Capacitación sobre modelos ..................................................................................................................................... 9
Qué significan los números ..................................................................................................................................... 10
Qué significan los números ..................................................................................................................................... 11
Aprendizaje profundo acelerado en las instalaciones ............................................................................................. 12
Qué significan los números ..................................................................................................................................... 13
Simplificación de la facilidad de uso ........................................................................................................................... 14
La gran verdad ................................................................................................................................................................. 16
El objetivo de las validaciones técnicas de ESG es educar a los profesionales de TI acera de soluciones de tecnología de la información para empresas de todos los tipos y tamaños. Las validaciones técnicas de ESG no pretenden reemplazar el proceso de evaluación que debe realizarse antes de tomar decisiones de compra, sino proporcionar información valiosa de estas tecnologías emergentes. Nuestros objetivos son explorar algunas de las características y funciones más valiosas de las soluciones de TI, mostrar cómo se pueden utilizar para resolver problemas reales de los clientes e identificar las áreas que necesitan mejoras. La perspectiva de terceros expertos del equipo de validación de ESG se basa en nuestras propias pruebas prácticas, así como en entrevistas con clientes que utilizan estos productos en entornos de producción.
Validación técnica: Dell EMC Ready Solutions for AI: Aprendizaje profundo con Intel 3
Esta validación técnica de ESG documenta la evaluación de Dell EMC Ready Solutions for AI. Aprendizaje profundo con
Intel. Nos centramos en comprender el rendimiento, la facilidad de uso y el costo total de propiedad (TCO) de la solución.
Para validar el rendimiento de la pila completa, medimos el número de tokens por segundo que se procesaron al
capacitar el modelo Token2Token Big Transformer y evaluamos cómo Nauta, una iniciativa de código abierto de Intel,
acelera la capacitación del modelo de aprendizaje profundo. También comparamos la manera en que Nauta simplifica
el proceso de capacitación de aprendizaje profundo y cómo el TCO del aprendizaje profundo con Intel se compara con
la ejecución de las mismas tareas en un servicio de IA de nube pública principal.
Antecedentes
Como resultado del aumento de la potencia y la densidad de cómputo, los procesadores especializados de inteligencia
artificial (IA) y los nuevos algoritmos, el aprendizaje automático (ML) y el aprendizaje profundo (DL) han pasado de la
prueba de concepto directamente a la empresa, donde muchas organizaciones están implementando programas de
IA. Según la investigación de ESG, el 59 % de los encuestados esperaba que sus gastos en IA/ML aumentaran en 2019,
mientras que el 31 % de las organizaciones indicaron que aprovechar IA/ML en sus productos y servicios de TI fue
una de las áreas de modernización del centro de datos en las que esperaban las inversiones más importantes en
los próximos 12-18 meses.1
Las organizaciones que buscan aprovechar la potencia de la IA enfrentan retos importantes. El 35 % de los encuestados
en una encuesta de ESG mencionó el costo de la infraestructura de TI como su mayor reto, mientras que el 29 %
mencionó las funcionalidades de la infraestructura de TI y el 21 % mencionó el entorno de desarrollo de aplicaciones
(consulte la Figura 1).2
Figura 1. Retos de datos, tecnología y costos de IA/ML
Fuente: Enterprise Strategy Group
1 Fuente: Informe de investigación de ESG, 2019 Encuesta de intenciones de gasto en tecnología, febrero de 2019. 2 Fuente: Resultados de la encuesta maestra de ESG, la inteligencia artificial y el aprendizaje automático: Cómo determinar el valor de la infraestructura, marzo de 2019.
El rendimiento y la escalabilidad son las preocupaciones clave de la capacitación de los científicos de datos modelos de IA. Las soluciones más rápidas permiten a los científicos de datos probar con conjuntos de datos más grandes y experimentar con más combinaciones de hiperparámetros que pueden producir modelos más precisos y una convergencia más rápida para los modelos de IA listos para la producción.
ESG validó que el aprendizaje profundo con Intel mejora el rendimiento mediante el aprovechamiento de la coordinación y la agrupación. La capacitación de modelo se ejecutó hasta un 18 % más rápido con Nauta y la solución procesó 16 960 tokens por segundo con 16 nodos de procesamiento que ejecutaban estudiantes en contenedores en paralelo.
El rendimiento del aprendizaje profundo con Intel escaló casi linealmente y la solución alcanzó el 80 % o más de rendimiento teórico máximo, ya que la capacitación escaló de uno a 16 nodos de procesamiento.
Validación técnica: Dell EMC Ready Solutions for AI: Aprendizaje profundo con Intel 9
La implementación de aceleradores de GPU para el aprendizaje profundo impone un costo adicional de $295 000
(34 % más) para un rendimiento comparable.
4 Fuente: Resultados de la encuesta maestra de ESG, la inteligencia artificial y el aprendizaje automático: Cómo determinar el valor de la infraestructura, marzo de 2019.
Por qué es importante
Según la investigación de ESG, el costo de la infraestructura es el reto de IA/ML citado más a menudo por las organizaciones.4 Por lo tanto, no sorprende que los servicios de IA de nube pública sean atractivos, ya que presentan bajos costos de inicio, y los servicios se categorizan como gastos operativos.
ESG validó que el TCO de tres años para el aprendizaje profundo con Intel, una solución en las instalaciones, es significativamente más económico que la utilización de servicios de IA de nube pública. Para el desarrollo de modelos de aprendizaje profundo, el aprendizaje profundo con Intel proporciona un ahorro de costos del 24 %, más de $238 000. Para la inferencia de aprendizaje profundo, la solución Dell EMC en las instalaciones proporciona un ahorro de costos del 13 %, casi $61 000.
Los costos de los servicios de IA de nube pública pueden variar en gran medida, y los costos mensuales pueden ser sorprendentemente altos cuando los errores involuntarios provienen de procesos incontrolables que consumen un tiempo de CPU excesivo y costoso, o genera enormes volúmenes de datos. La experimentación de los científicos de datos puede consumir más tiempo de procesamiento que el previsto originalmente, lo cual aumenta los costos y rompe las suposiciones presupuestarias. Por el contrario, el aprendizaje profundo con la solución de Intel en las instalaciones proporciona a los administradores y a los contadores financieros los gastos conocidos y predecibles.
Figura 8. Optimización de hiperparámetro para la infraestructura de IA tradicional y aprendizaje profundo con Intel
Fuente: Enterprise Strategy Group
En las infraestructuras de IA tradicionales, se requiere un promedio de cinco minutos para configurar un trabajo
y un minuto adicional para enviar el trabajo. Un experimento de ajuste de hiperparámetro con 300 trabajos
requeriría 30 horas de tiempo y esfuerzo de científico de datos.
El uso de Nauta tardaría 5 minutos en configurar y enviar los 300 trabajos, lo que libera al científico de datos para
que realice otras tareas. En función de los requisitos de trabajo, la Dell EMC Ready Solution para IA/DL con Intel
puede ejecutar hasta 16 trabajos de manera simultánea, lo que puede reducir el tiempo de ejecución total y mejorar
el tiempo de implementación.
Por qué es importante
El aprendizaje profundo es complejo y desafiante, y la dificultad de desarrollo de modelos se ve exacerbada por una falta de personal experimentado o capacitado y la complejidad de la pila de infraestructura. Los científicos de datos usan una gran combinación de herramientas con licencia y de código abierto que complican en gran medida el proceso de aprendizaje cíclico e iterativo que impulsa los ML. Esto genera problemas relacionados con el tiempo para el valor comercial. Se requiere una solución que simplifique la implementación de la infraestructura y automatice el proceso de desarrollo de modelos de DL.
La validación de ESG reveló que el aprendizaje profundo con la implementación simplificada de Intel: Dell EMC Professional Services llevará a cabo la implementación y la configuración iniciales. Nauta simplificó y automatizó la carga de trabajo del científico de datos y permitió el ajuste de los hiperparámetros sin supervisión. El aprendizaje profundo con Intel puede reducir el tiempo de ejecución de un experimento de ajuste de hiperparámetros de 300 trabajos de 30 horas a solo unos minutos, lo que permite que el científico de datos centre su esfuerzo en otras tareas no triviales.
Validación técnica: Dell EMC Ready Solutions for AI: Aprendizaje profundo con Intel 16
Enterprise Strategy Group es una empresa de análisis, investigación, validación y estrategia de TI que ofrece inteligencia del mercado e información útil a la comunidad mundial de TI.