Top Banner
DESEMPEÑO DE LA TÉCNICA DE REDES NEURONALES ARTIFICIALES, FRENTE A LOS MODELOS DE SERIES DE TIEMPO ARIMA-GARCH EN LA PREDICCIÓN DE LOS PRECIOS DE LA ACCIÓN DE BANCOLOMBIA. Trabajo de grado presentado por: JOSÉ RICADO MACIADO VÁSQUEZ En cumplimiento de los requisitos para optar al título de Ingeniero Financiero en la Universidad Piloto de Colombia Bogotá, Enero de 2013
109

TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Nov 14, 2021

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

DESEMPEÑO DE LA TÉCNICA DE REDES NEURONALES ARTIFIC IALES, FRENTE A LOS MODELOS DE SERIES DE TIEMPO ARIMA-GARC H EN LA

PREDICCIÓN DE LOS PRECIOS DE LA ACCIÓN DE BANCOLOMB IA.

Trabajo de grado presentado por:

JOSÉ RICADO MACIADO VÁSQUEZ

En cumplimiento de los requisitos para optar al título de Ingeniero Financiero en la Universidad Piloto de Colombia

Bogotá, Enero de 2013

Page 2: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

DESEMPEÑO DE LA TÉCNICA DE REDES NEURONALES ARTIFIC IALES, FRENTE A LOS MODELOS DE SERIES DE TIEMPO ARIMA-GARC H EN LA

PREDICCIÓN DE LOS PRECIOS DE LA ACCIÓN DE BANCOLOMB IA.

Trabajo de grado presentado por:

JOSÉ RICADO MACIADO VÁSQUEZ

A

UNIVERSIDAD PILOTO DE COLOMBIA FACULTAD DE INGENIERÍ A

PROGRAMA DE INGENIERÍA FINANCIERA

Bajo la dirección de:

CARLOS MARIO GARCÍA DÍAZ PROFESOR DEL PROGRAMA DE INGENIERÍA FINANCIERA

En cumplimiento de los requisitos para optar al título de Ingeniero Financiero en la Universidad Piloto de Colombia

Bogotá, Enero de 2013

Page 3: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

CONTENIDO

1. PLANTEAMIENTO DEL PROBLEMA. 1.1 PROBLEMA. 1.2 CONTEXTO.

1.2.1 EL MERCADO DE ACCIONES EN GENERAL. 1.2.2 EL MERCADO DE ACCIONES EN COLOMBIA. 1.2.3 BREVE HISTORIA DE LA BANCA MUNDIAL, EL SECTOR DE

LA BANCA EN COLOMBIA Y ANÁLISIS FUNDAMENTAL DE BANCOLOMBIA.

2. MARCO TEÓRICO E HIPÓTESIS.

2.1 MARCO TEÓRICO.

2.1.1 HIPÓTESIS DEL MERCADO EFICIENTE. 2.1.2 TÉCNICA DE SERIES DE TIEMPO PARA PREDICCIÓN:

MODELOS ARIMA Y GARCH.

2.1.2.1 GENERALIDADES DEL MODELO ARIMA Y GARCH.

2.1.2.2 ESPECIFICACIÓN GENERAL DE LOS MODELOS ARIMA Y GARCH.

2.1.3 TÉCNICA ARTIFICIAL PARA PREDICCIÓN: RED NEURONAL.

2.1.3.1 CONCEPTO DE RED NEURONAL ARTIFICIAL. 2.1.3.2 ELEMENTOS DE UNA RED NEURONAL ARTIFICIAL. 2.1.3.3 CARACTERÍSTICAS DE UNA RED NEURONAL

ARTIFICIAL. 2.1.3.4 ESTRUCTURACIÓN DE UNA RED NEURONAL

ARTIFICIAL. 2.1.3.5 REPRESENTACIÓN MATRICIAL DE LA RED

NEURONAL ARTIFICIAL. 2.1.3.6 REPRESENTACIÓN MATEMÁTICA DE LA RED

NEURONAL ARTIFICIAL.

Page 4: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3.7 DESVENTAJAS DE LAS RNA.

2.2 HIPÓTESIS DE LA INVESTIGACIÓN.

3. MODELAMIENTO PARA LA PREDICCIÓN. 3.1 ANÁLISIS DE LA SERIE HISTÓRICA DE LOS PRECIOS

DIARIOS DE LA ACCIÓN DE BANCOLOMBIA.

3.2 MODELOS ARIMA Y GARCH. 3.2.1 DIVISIÓN DEL CONJUNTO DE DATOS. 3.2.2 PRUEBA DE ESTACIONARIEDAD DE LA SERIE. 3.2.3 ESTIMACIÓN DEL MODELO ARIMA Y REALIZACIÓN DE LA

PRUEBA ARCH-LM. 3.2.4 ESPECIFICACIÓN DEL MODELO ARIMA. 3.2.5 ESPECIFICACIÓN DEL MODELO ARIMA-GARCH. 3.2.6 EVALUACIÓN Y ELECCIÓN DEL MEJOR MODELO ARIMA-

GARCH. 3.2.7 PRUEBA DE NO LINEALIDAD SOBRE LA SERIE DE

PRECIOS.

3.3 MODELO DE RED NEURONAL ARTIFICIAL. 3.3.1 ESPECIFICACIÓN DE LA RED NEURONAL ARTIFICIAL.

3.3.1.1 CARACTERÍSTICAS DEL MODELO RNA DE LA

INVESTIGACIÓN. 3.3.1.2 DIVISIÓN DEL CONJUNTO DE DATOS. 3.3.1.3 SELECCIÓN DE PESOS Y UMBRALES INICIALES. 3.3.1.4 SELECCIÓN DE LAS VARIABLES QUE AYUDAN A

EXPLICAR EL MODELO RNA DE ESTE TRABAJO. 3.3.1.5 SELECCIÓN DEL ALGORITMO DE APRENDIZAJE.

3.3.2 ESTIMACIÓN DEL MODELO DE RED NEURONAL AUTORREGRESIVA.

Page 5: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

3.3.3 EVALUACIÓN DEL MEJOR MODELO ENTRE RNA Y ARIMA -GARCH.

4. EVALUACIÓN FINANCIERA DEL RESULTADO DE PRONÓSTIC O DERIVADO DEL MEJOR MODELO. 4.1 ESTRATEGIA PROPUESTA. 4.2 EVALUACIÓN FINANCIERA DE LA ESTRATEGIA PROPUES TA.

5. CONCLUCIONES Y RECOMENDACIONES.

REFERENCIAS BIBLIOGRÁFICAS.

ANEXOS.

ANEXOS 1: SALIDAS DE PRUEBAS Y RESULTADOS DE LOS MO DELOS ARIMA Y GARCH – EVIEWS.

ANEXOS 2: FORMULAS PARA MEDIDAS DE EVALUACIÓN DE PRONÓSTICOS (ESTADÍSTICOS DE ERROR).

Page 6: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

1. PLANTEAMIENTO DEL PROBLEMA Y CONTEXTO

1.1 PROBLEMA.

¿Qué ventajas a nivel teórico y cuantitativo presentan los modelos de inteligencia artificial de redes neuronales frente a los modelos tradicionales de series de tiempo ARIMA-GARCH, basados en el desempeño en predicción del comportamiento del precio de la acción de BANCOLOMBIA?

1.2 CONTEXTO.

Este trabajo tiene la intención de modelar el comportamiento de la rentabilidad de la acción de BANCOLOMBIA, para generar predicciones que proporcionen información útil en la toma de decisiones sobre mantener posición, comprar o vender acciones de dicha entidad financiera, para ello es indispensable tener conocimiento del mercado financiero en el que se transan estas acciones, también se debe entender y analizar el sector económico del que hace parte la compañía, todo esto con el fin de buscar características, hechos, variables y particularidades que accedan a explicar dichos comportamientos.

1.2.1 EL MERCADO DE ACCIONES EN GENERAL.

Los mercados financieros mundiales ofrecen diferentes posibilidades de inversión, tanto de renta fija como de renta variable, dentro de las alternativas que ofrece para renta variable está el mercado de acciones, este mercado representa el capital de las empresas incorporado en títulos valores llamados acciones y por consiguiente cuando se adquieren éstas, se está haciendo socio de las mismas, además se adquieren derechos económicos y políticos sobre dichas empresas.

Dentro de los derechos económicos que se adquieren, está el de negociar libremente los títulos valores representativos del capital de la compañía, una de las principales características que tiene esta clase de títulos valores es que son libremente negociables, esto quiere decir, que cuando se adquieren, se tiene el derecho de venderlas cuando se requiera disponer de los recursos inicialmente invertidos; un derecho indispensable es el de participar de las utilidades que registra la compañía (dividendos) y de la valorización o perdida determinada por la diferencia entre el precio de compra y de venta de dichos títulos.

Page 7: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Un hecho relevante y llamativo para la mayoría de los inversionistas, es la de invertir en acciones, sabiendo que tienen un beneficio tributario en los mercados de valores nacionales e internacionales; para el caso colombiano la utilidad de vender acciones no genera impuesto de renta ni de ganancia ocasional, tampoco genera retención en la fuente.

Los derechos políticos también constituyen una característica fundamental en las acciones, este derecho indica de forma general que el inversionista tiene la posibilidad de participar y votar en la asamblea de accionistas y de revisar la contabilidad de la empresa.

Existen tres tipos de acciones en los principales mercados internacionales, las acciones ordinarias, las acciones preferenciales y las acciones privilegiadas, cada una de estas otorgan distintos derechos políticos y económicos.

Las acciones de tipo ordinarias, le otorgan al titular algunos derechos de participación como el de recibir dividendos y voto en la asamblea de accionistas, las acciones preferenciales, dan al inversionista prioridad en el pago de dividendos en caso de liquidación de la compañía, estas no dan derecho a voto en la asamblea de accionistas, y las acciones privilegiadas otorgan los mismos derechos que las acciones ordinarias y además algunos privilegios como el derecho preferencial para su reembolso en caso de liquidación de la empresa. Otra característica de las acciones es que se pueden adquirir de dos formas, se puede obtener los títulos en el mercado primario o en el mercado secundario; en el mercado primario, en la mayoría de casos se obtiene directamente del emisor, mientras que en el mercado secundario se pueden obtener por parte de otros accionistas1.

En cuanto a la rentabilidad, las acciones tiene una utilidad variable, esta solo se conoce al momento de liquidar el título y también depende del resultado que obtenga la empresa. La rentabilidad de las acciones está compuesta por dos elementos, uno de ellos es la valorización, está determina el precio cuando el emisor obtiene ganancias; cuando se dice que el titulo gano valor o se valorizo, el precio de negociación de dicha acción en el mercado secundario se incrementa en comparación con el precio de emisión2.

El otro elemento que compone la rentabilidad de las acciones son los dividendos; estos se presentan si el emisor del título genera utilidades durante el periodo

1 Juan Mascareñas, (2005) artículo: El Mercado internacional de Acciones. Universidad Complutense de

Madrid. 2 AMV Colombia, (2009) articulo: Programa para la educación del inversionista del mercado de valores en

www.amvcolombia.org.co.

Page 8: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

respectivo, para tal caso la asamblea general de accionistas debe definir el monto, la forma de pago y la periodicidad de los mismos.

Parte importante del mercado de acciones es la evaluación de la situación financiera, legal y administrativa de la empresa en la cual se va a invertir, esto hace parte del análisis fundamental en el mercado de acciones que sirve para la toma de decisiones y por consiguiente es necesario conocer los estados financieros, el sector económico en que se desarrolla, su código de gobierno corporativo, la misión, la visión y la política de dividendos.

Bajo el mismo tema, es necesario tener en cuenta que el mercado de acciones maneja diferentes metodologías para su negociación, dentro de estas metodologías tenemos el análisis técnico y el análisis fundamental, el análisis técnico tiene como referencia el comportamiento histórico del precio del activo para predecir su movimiento futuro, tema principal que hace parte de esta investigación, mientras que el análisis fundamental se apoya en información de noticias y de indicadores como la inflación, las tasas de interés, el PIB, la tasa de desempleo, la política y el análisis sectorial.

Se da a conocer esta información para entender de una manera general bajo qué condiciones funciona todo el sistema del mercado de acciones y tambien dar una visión de toda la mecánica que se da a través de sus operaciones.

1.2.2 EL MERCADO DE ACCIONES EN COLOMBIA

El comienzo del mercado de acciones en Colombia se dio a finales del siglo XVI e inicios del siglo XVII, cuando algunas compañías tomaron la decisión de emitir acciones como medio para poder obtener recursos financieros. Posteriormente, a comienzos del siglo XX, algunos sectores empresariales iniciaron un proceso de industrialización y consecutivamente se dio el auge del sector cafetero, dando como resultado un mayor movimiento en el mercado accionario, generando la necesidad de crear un escenario de negociación.

Para el año 1928, un conjunto de empresas toman la decisión de crear una bolsa de valores para facilitar las actividades de transacción de las operaciones, y entre el banco de Colombia, nacional de chocolates y el banco de Bogotá, además de otro grupo de empresas, dan el surgimiento de la bolsa de valores de Bogotá con

Page 9: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

un capital inicial de COP$20.000, y como dato histórico, la primera rueda de negociación en la bolsa de Bogotá, se dio el 2 de abril de 1929.

En el año 1961 dan origen a la bolsa de Medellín con un capital inicial de COP$522.000, procedente de la asociación de corredores de Medellín; 22 años más tarde, en el año 1983, se crea la bolsa de Occidente en la ciudad de Cali.

Posteriormente entre los años 1980 y 1990 el país estaba pasando por la difícil situación del narcotráfico, hecho que afecto los mercados de valores de las tres ciudades, además el mercado de acciones se encontraba disperso en cotizaciones e índices de referencia, dando paso así a una posible unificación de las tres bolsas de valores de Colombia.

Fue el 3 de julio del año 2001 cuando finalmente se integraron las tres bolsas existentes en Colombia, (La bolsa de Bogotá, la de Medellín y la de Occidente). Esta unificación origino la existencia de la actual bolsa de valores de Colombia (BVC), otorgándole al mercado profundidad, transparencia y dinamismo.

Como datos recientes, a partir del 18 de abril del año 2007, es posible hacer transacciones de compra y de venta de acciones inscritas en la BVC desde internet, iniciativa que ha sido tomada por barias comisionistas de bolsa en todo el país; adicionalmente la BVC está impulsando un nuevo sistema de información de precios de acciones y otros activos en tiempo real a través del celular llamado BVC Móvil.

La bolsa de valores de Colombia es la bolsa con mayor volumen de activos financieros negociados de Latinoamérica, teniendo en cuenta que este está compuesto por un 98% por títulos de deuda pública. En lo que se refiere al tema de acciones, la BVC se encuentra de cuarto puesto después de la bolsa de Brasil (Ibovespa), de la bolsa de Chile (Bolsa de Valores de Santiago), y de la bolsa de México (Bolsa Mexicana de Valores).

En cuanto a la regulación y supervisión del mercado de acciones, este ésta a cargo de tres entidades, el congreso de la república, que expide la ley marco del mercado de valores, el gobierno nacional, a través del ministerio de hacienda y crédito público, el cual expide regulaciones que concretan las normas generales de la ley marco, y por último esta la superintendencia financiera, la cual dicta instrucciones sobre el cumplimiento de las normas emitidas por el ministerio de hacienda y crédito público.

Dentro del mismo contexto, se tienen otras entidades privadas con competencias reguladoras que velan por la transparencia del mercado, dentro de ellas hablamos del Autorregulador del Mercado de Valores, conocida por sus siglas como AMV, el

Page 10: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

cual es el primer supervisor privado independiente constituido en Colombia desde el año 2006. El AMV, ha creado una serie de regulaciones y políticas para todos los emisores y operadores del mercado de valores, dentro de los cuales podemos destacar un examen de certificación para las personas que quieran ser operadores del mercado de valores colombiano, con vigencia máxima de 2 años.

Es importante resaltar que, en cierta parte de la historia de las bolsas de valores de Colombia, éstas funcionaban por medio del sistema de viva voz para la compra y venta de acciones. Actualmente la BVC utiliza varios sistemas de transacción para los diferentes mercados y operaciones que maneja, dentro de los cuales se destacan:

• El Sistema electrónico de negociación X-stream, por el cual se realizan las operaciones de derivados sobre subyacentes y se maneja todo el tema del mercado accionario local.

• El Sistema electrónico de negociación MEC Plus, por el cual se realizan las operaciones de renta fija, administradas por la bolsa de valores de Colombia.

• El Sistema electrónico de registro INVERLACE, en donde se negocian títulos de renta fija públicos y privados, y adicionalmente operaciones de derivados sobre los títulos.

• El Sistema electrónico de negociación SEN, el cual es administrado por el Banco de la Republica y en donde se operan TES B, Bonos FOGAFIN y títulos de desarrollo hipotecario.

• SET-FX, por el cual se opera las transacciones del mercado cambiario en Colombia, este sistema es administrado por la BVC y permite el intercambio de divisas en el mercado spot3 y mercado next day4.

Por otra parte, el mercado de acciones de Colombia maneja tres indicadores principales, calculados y generados por la BVC, estos son el IGBC, El Colcap y el Col20 ; el Colcap y el Col20 se crearon en diciembre del año 2007 con el propósito de medir el mercado desde su liquidez y su capitalización.

Continuando en el contexto del mercado de acciones en Colombia, es importante resaltar que actualmente la BVC está llevando un proceso de integración con la bolsa de valores de lima (BVL) y la bolsa de comercio de Santiago (BCS), éste proyecto de integración fue llevado en dos fases fundamentales, la primera de ellas, bajo el nombre de “Enrutamiento Intermediado” que comenzó desde 3 Mercado de divisas donde se estipula que el día de la operación es el mismo día de cumplimiento de la

transacción. 4 Mercado de divisas donde se estipula que el cumplimiento de la operación es en T+1 o T+2.

Page 11: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

noviembre de 2010 y permite la participación de los inversionistas de cada país, al mercado de valores de los tres países a través de agentes intermediarios de cada bolsa. La segunda etapa, tiene como finalidad el acceso total de los intermediarios de cada bolsa en los tres países y la estandarización en las reglas de negociación. Todo este proceso de integración se hace con el objetivo principal de generar un acceso más amplio a los mercados de cada uno de los países integrantes y la posibilidad de competir con grandes bolsas de Latinoamérica como la de Brasil y la de México.

Otro tema importante en el campo del mercado de acciones colombiano, son las clasificaciones de los tipos de acciones; para el caso colombiano y de acuerdo a las leyes, los tres tipos de acciones que se pueden negociar en Colombia están determinados de la siguiente manera:

Tabla 1. Clasificación de los tipos de acción de acuerdo a sus derechos, para el caso Colombiano:

Fuente: www.amvcolombia.org.co

En el mismo contexto, es importante tener en cuenta que las acciones se pueden adquirir en el mercado primario o secundario por medio de una oferta pública o una oferta privada, en el caso de oferta privada, ésta se da, cuando la oferta está

Page 12: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

dirigida a menos de 100 personas determinadas o a menos de 500 accionistas del emisor.

Para la oferta pública, se dirige a personas no determinadas, o a 100 o más personas determinadas.

Por lo general, la oferta pública se hace por medio de un proceso de democratización mediante el cual se puede comprar acciones al emisor de dichas acciones. Este proceso se hace por medio de una comisionista de bolsa, las cuales son las únicas entidades autorizadas por la superintendencia financiera de Colombia, para realizar dichas operaciones y tener los títulos.

En lo que concierne al mercado secundario de acciones, éste se desarrolla de forma electrónica, mediante una plataforma que es administrada por la BVC llamada X-STREAM. Se tiene dos formas de acceder a este mercado: de forma directa o individual; es necesario dirigirse a una comisionista de bolsa ya que son las únicas entidades autorizadas para comprar o vender acciones en el mercado secundario.

La otra forma de adquirir acciones por medio del mercado secundario, es de forma indirecta y colectiva; los medios colectivos de portafolios de inversión son administrados por intermediarios de valores autorizados.

Dentro de los medios colectivos para la obtención de acciones en Colombia se tienen:

� Las carteras colectivas: éstas se generan por la unión de recursos de varios inversionistas en un portafolio colectivo, administrado por los intermediarios autorizados como por ejemplo las entidades fiduciarias. Su clasificación está determinada por el tiempo de la inversión y por aspectos como el momento de retiro de la participación:

Page 13: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Tabla 2. Clasificación de los tipos de carteras colectivas:

Fuente: www.amvcolombia.org.co

� Los fondos de pensiones voluntarios: éste medio, crea portafolios

generados por los recursos de varios inversionistas y son administrados por fiduciarias, entidades aseguradoras de vida y fondos de pensiones y cesantías.

El mercado de acciones colombiano tiene algunas operaciones particulares y especiales, más que todo en el mercado secundario, éstas tienen como objetivo, proteger los intereses de los inversionistas minoritarios cuando hay transacciones de compra o de venta por grandes cantidades de acciones. Las operaciones especiales tienen que ser autorizadas antes por la Superintendencia financiera de Colombia.

Estas operaciones son:

� Oferta Pública de Adquisición (OPA): Ésta operación se da cuando el inversionista quiere aumentar su participación en un emisor, en un porcentaje igual o superior al 25% del total de acciones en circulación, o cuando el inversionista adquiere un porcentaje superior al 5% y ya se tiene más de ese 25%.

� Martillo: es una operación especial de ventas de acciones al mejor precio. Ésta operación es manejada bajo un esquema de subasta inglesa.

Page 14: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Bajo el mismo tema, se tiene el concepto de los dividendos, éstos se pueden dar de forma mensual, trimestral o en fechas específicas en el transcurso del año. Al conocer la fecha exacta del pago de los dividendos, se puede determinar y calcular el periodo ex-dividendo, éste se debe tener en cuenta a la hora de comprar o vender acciones. El periodo ex-dividendo es especificado por el intervalo de tiempo entre la fecha de pago del dividendo y los 10 días hábiles anteriores. Las operaciones que se hagan dentro de este periodo incluyendo la fecha del pago, el dividendo queda a favor del que vende la acción mientras que las operaciones que se registren después de ese periodo, serán a favor del comprador de la acción.

Grafico 1. Especificación del periodo ex-dividendo.

Fuente: www.amvcolombia.org.co

Dentro del mercado de acciones colombiano, se pueden registrar diferentes tipos de operaciones, una de ellas es la compraventa definitiva o de contado que radica en comprar o vender acciones entre inversionistas. Otros tipos de operaciones permitidas están definidas como operaciones para inversionistas especializados , dentro de las cuales se tiene las operaciones repo y las cuentas de margen.

Las operaciones repo (operaciones de venta con pacto de recompra), consisten en que un inversionista (inversionista pasivo), transfiere a otro la propiedad de unas acciones (inversionista activo), en contraprestación de una suma de dinero. El inversionista activo se compromete a que en cierta fecha acordada devolverá las acciones al inversionista pasivo, donde se pagara una cantidad de dinero con los intereses correspondientes previamente acordados.

Las cuentas de margen en acciones son utilizadas para que las sociedades comisionistas de bolsa o las entidades fiduciarias puedan comprar o vender acciones a nombre de un inversionista por un valor superior a sus recursos

Page 15: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

disponibles. Para operar este tipo de transacciones, es necesario que el inversionista entregue a la comisionista de bolsa recursos por mínimo el 50% del monto total que quiere invertir, teniendo en cuenta que se hacen sobre acciones catalogadas como de alta liquidez.

Un aspecto importante que se debe tener en cuenta, es la situación de la empresa en la cual se quiere invertir; es necesario hacer una evaluación minuciosa de la situación financiera, legal y administrativa del emisor. Toda esta información significativa está disponible en la Superintendencia financiera de Colombia.

Para finalizar, se procede a mostrar algunas graficas tomadas del informe de gestión de la bolsa de valores de Colombia del año 2011, donde se identifican aspectos importantes en el mercado de acciones colombiano:

Grafico 2. Evolución de la renta variable desde el año 2007 hasta el año 2011.

Fuente: Bolsa de valores de Colombia. Informe de gestión anual, año 2011.

Durante el año 2011, el informe de gestión de la BVC resalta lo siguiente: “En lo que concierne al mercado de renta variable, se tuvo un record histórico de COP $13 billones colocados en emisiones primarias de acciones, se inició las operaciones del mercado integrado latinoamericano (MILA), se lanzó el primer fondo bursátil (ETF iShares COLCAP), llegaron cinco nuevos emisores al mercado, y hubo un aumento en la participación de inversionistas extranjeros. Estos fueron los principales acontecimientos ocurridos durante el año 2011 para el marcado de acciones colombiano. Por otra parte el volumen total operado del mercado alcanzo un nuevo

Page 16: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

máximo de COP $68,2 billones, de los cuales COP $40,9 billones corresponden a operaciones de contado (compraventa), COP $27.2 billones a operaciones repo y COP $0.08 billones a operaciones TTV. El monto promedio diario de negociación en operaciones de contado registro un incremento de 9,36% al pasar de COP $151.524 millones en 2010 a COP $165.707 millones en 2011. Así mismo, los intermediarios realizaron 724.945 operaciones a través de los sistemas transaccionales de la BVC durante el año, lo que representa un promedio de 2.934 operaciones diarias. De otra parte, como consecuencia del aumento en las colocaciones primarias y el ingreso de cinco nuevos emisores, el flotante del mercado tuvo un incremento de 39,63% y la rotación promedio pasó de 9,90% en enero, a 13,26% en diciembre”.

Grafico 3. Volumen de operaciones de contado del mercado de renta variable desde el año 2005 hasta el año 2011.

Fuente: Bolsa de valores de Colombia. Informe de gestión anual, año 2011.

Page 17: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 4. Personas naturales con inversión en acciones (Evolución desde el año 2005 al año 2011).

Fuente: Bolsa de valores de Colombia. Informe de gestión anual, año 2011.

1.2.3 BREVE HISTORIA DE LA BANCA MUNDIAL, EL SECTOR DE LA BANCA EN COLOMBIA Y ANÁLISIS FUNDAMENTAL DE BANCOLOMBIA.

Historia de la banca mundial.

La banca a nivel general se origina con los primeros trueques o intercambios de mercancías entre tribus y pueblos en todo el mundo, es muy difícil determinar el origen histórico formal del sistema bancario, tanto a nivel mundial como a nivel colombiano, sin embargo se tienen unos rasgos históricos de sucesos que pueden llegar a explicar sus inicios y detallan su evolución hasta nuestros días.

Los primeros sucesos se tienen desde la época de Mesopotamia en el año 3.400 a.C. y Babilonia 2.250 a.C. donde los sacerdotes y monarcas de la época antigua realizaban custodias y permitían que la población depositara sus cosechas y bienes personales, dando un deposito como anticipo por el pago de la custodia.

En Egipto el dinero se originó aproximadamente en el año 1.800 a.C. como medio de cambio, con el cual dan orígenes a aspectos como las políticas financieras para

Page 18: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

préstamos, cambio de moneda, recaudo de impuestos, contratos y órdenes de pago; por otra parte el imperio romano fue el primero en promulgar leyes que prohibían el cobro excesivo de intereses, conocidas como la ley de las doce tablas, la ley de genucia y la ley de Onciarum Foenus, con intereses máximos del 12%5.

Ya para la edad media en Europa, se consideraron como los primeros banqueros formales de la historia a los judíos, esto porque ellos no tenían las limitaciones de las leyes que promulgaba la iglesia y podían ejercer la función de prestamistas independientes. El primer asentamiento de los judíos banqueros fue en Lombardía (Italia), y es por esta razón que la historia los llama como los lombardos, posteriormente fueron desterrados de esta tierra y se establecieron en Inglaterra, en una calle que fue y aun es conocida como Lombard.

Para el siglo XII d.C. se originaron en Génova (Italia), los Banchieri, cambistas que realizaban sus operaciones sentados en sus bancos en todas las plazas públicas de esa ciudad, recibiendo depósitos que después invertían en operaciones de cambio marítimo y llegaron a administrar la deuda pública de Génova cuando se creó en 1407 el Banco de San Jorge de Génova.

Al llegar a esta etapa de la historia, se da origen a la palabra “Banco” , y es fundamentada por el mueble sobre el cual se hacían las operaciones de los cambistas. Para el momento en que los negocios no prosperaban, los cambistas rompían el banco sobre la mesa en señal de su quiebra y de ahí se origina el concepto de “Banca Rota” .

“La historia contempla al Banco de Inglaterra como el primer banco central y de emisión de moneda creado en 1694, mediante el cual se utilizaron productos como el cheque, las notas de caja, las letras de cambio, los pagarés y las obligaciones”6.

El sector de la banca en Colombia.

Para el caso Colombiano, este se sitúa durante el dominio español, en esta época se imponía el uso de la moneda española en el territorio colonial, circulaban monedas como el real, la onza, la media onza, el doblón y el escudo como moneda de oro.

5 Sergio Iván Zapata Sierra, Articulo: “Historia Sistema Financiero Colombiano”, www.gacetafinanciera.com,

Página 1. 6 Sergio Iván Zapata Sierra, Articulo:”Historia Sistema Financiero Colombiano”, www.gacetafinanciera.com,

Página 2.

Page 19: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

La iglesia católica de la época estableció medios para otorgar créditos a través de hipotecas de inmuebles, esto se conoció en su época como la “Capellanía”, por la cual algunos bienes inmuebles quedaban sujetos al cumplimiento de misas y de otros compromisos religiosos.

El objetivo de establecer un banco estatal, para poder financiar al gobierno se promulgo por vez primera en el Congreso Constituyente de Cúcuta en el año 1821, pero este fracaso en su intento; para el año 1833, una nueva ley determino que la actividad bancaria hacia parte de la actividad comercial, en el año 1839, Judas Tadeo Landinez creo en Bogotá un establecimiento mercantil y financiero, que posteriormente se convirtió en una empresa de giro y descuento, considerado en esa época como un banco privado y que en algunos años posteriores origino la primera banca rota de la historia de Colombia.

La banca comercial en Colombia comenzó en los años sesenta del siglo XIX, cuando el país empezó a realizar exportaciones agrícolas, para esta época se utilizó el modelo conocido como “Banca Libre”, mediante el cual se daba responsabilidad al banco privado para mantener la confianza del público en los billetes convertibles en oro emitidos por dichos bancos, esto sucedida a consecuencia de la falta de un banco central y de una regulación estatal; para el año 1870 se fundó el Banco de Bogotá y en 1874 el Banco de Colombia .

La época de la “banca libre” no duro casi, para el año 1880, se creó una ley que autorizaba al presidente a organizar una Banco Nacional como agente financiero del gobierno central, y los bancos privados de esa época fueron obligados a aceptar los billetes emitidos por el nuevo Banco Nacional. Al final para los años noventa de ese siglo, el gobierno tomó la determinación de cerrarlo para evitar escándalos públicos debido a que este banco emitía billetes sin respaldo de oro, lo cual se podía considerar como una estafa en esa época.

En el año 1923, en el gobierno del presidente Pedro Nel Ospina, se consiguió una misión extranjera, liderada por el profesor Edwin Kemmerer de la universidad Princeton en los Estados Unidos, para que pusiera un orden a la moneda nacional y a las finanzas públicas nacionales, originando así la creación del Banco de la Republica y la Superintendencia bancaria, esta última tenía la misión de regular las actividades de los bancos nacionales y de algunos bancos extranjeros que ya se estaban estableciendo en el país como el Royal Bank of Canadá, el banco francés y el First National Citibank.

Para los años cincuenta del siglo XX, los bancos comerciales colombianos se enfocaron en el crédito de corto plazo para los agricultores; en el caso del crédito

Page 20: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

de largo plazo, este fue promulgado después del año 1950, creando así la época del crédito de fomento, que duraría hasta el año 1991.

Para concluir, se puede indicar que en la mitad del siglo XX, el sector bancario en Colombia estaba distribuido para financiar las diferentes actividades económicas del país, cada banco era especialista en la financiación de cierta actividad económica, ya para los años 90, comenzó un periodo de estandarización de la banca, donde ocurrieron hechos como el de la fusión de entidades, la quiebra de otras y la consolidación de otras más, llegando así al actual sistema bancario colombiano donde existen pocas entidades que abarcan el apoyo de diversos tipos de financiación para distintas actividades económicas en el país.

Hay que tener en cuenta la existencia de algunas fechas importantes para el sector de la banca en Colombia, dentro estas se destacan:

• (1930), Creación de la Caja Social de Ahorros. • (1932), Creación del Banco Central Hipotecario. • (1944), Creación del Banco Industrial Colombiano. • (1950), Creación del Banco Popular. • (1953), Creación del Banco Cafetero. • (1955), Creación del Banco Ganadero. • (1982), La crisis financiera del grupo Colombia. • (1985), La creación de Fogafin y la reestructuración de la

Superbancaria. • (1993), El origen del Estatuto Orgánico del Sistema Financiero. • La ley 510 de 1999 para el sistema UVR y la transformación de la

Superintendencia Bancaria y la superintendencia de valores en la Superintendencia Financiera de Colombia.

En la actualidad, el sector bancario en Colombia tiene una gran solidez que le ha permitido un crecimiento sostenible y ha sido inmune a varias crisis financieras mundiales que han surgido en lo corrido del comienzo del siglo XXI, en el apartado siguiente se mostraran algunas graficas con datos estadísticos generados por LA ASOBANCARIA, la asociación de bancos de Colombia en su informe de inclusión financiera con respecto al año 2011. En estos gráficos se muestra la situación actual de la banca en Colombia, además también se puede dar una idea del futuro de este importante sector en la economía del país.

Page 21: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 5. Indicador de bancarización: esta medido como la relación entre el número de personas mayores de edad con al menos un producto financiero, sobre el total de la población adulta, entre el año 2007 al año 2011.

Fuente: ASOBANCARIA. Informe de Inclusión Financiera, año 2011.

En el grafico 5, podemos destacar que entre el año 2007 al 2009, el indicador de bancarización tuvo un comportamiento estable, pero para el año 2010 este porcentaje se incrementó significativamente en un 5% aproximadamente, de tener 57,3% de cobertura a un 62,2%, dando aviso a una fuerte demanda de productos financieros para ese año, además de que la tendencia general en el rango de estudio es de crecimiento.

Grafico 6. Evolución del número de personas con crédito de consumo desde el año 2007 al año 2011.

Fuente: ASOBANCARIA. Informe de Inclusión Financiera, año 2011.

Page 22: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Para el caso del grafico 6, se puede observar una tendencia estable que explica como el crédito de consumo se ha mantenido en sus mismos volúmenes, basado en la cantidad por persona con este tipo de crédito; se puede analizar en términos generales que, del año 2007 al 2011, se ha presentado un comportamiento de crecimiento, pero al verificar su evolución a través de los años, éste no ha tenido grandes cambios de tendencia.

Grafico 7. Número de cuentas de ahorro en el país, datos desde año 2007 al año 2011.

Fuente: ASOBANCARIA. Informe de Inclusión Financiera, año 2011 y Superintendencia Financiera de Colombia, Informe de captaciones por rango.

En lo referido al grafico 7, podemos establecer que hay un gran auge de cuentas de ahorro en el país, y este se incrementó entre el año 2008 al 2009, de pasar a 34.6 millones de cuentas a 37.1 millones, para el año 2011 esta cifra llega a 39.7 millones, con una señal de que continuara incrementándose en el futuro.

Análisis fundamental de Bancolombia.

El banco de Colombia fue creado en el año 1875, con el fin de atender las necesidades de servicios financieros que tenía la economía de Colombia en ese momento.

La compañía se consolido en el año 1998 con la fusión que sucedió entre el Banco Industrial Colombiano y el Banco de Colombia, y además con la posterior

Page 23: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

integración de sus filiales, construyendo así uno de los más grandes conglomerados financieros del país.

� Principales Filiales de Bancolombia y una breve his toria.

Conavi

Para Octubre del año 1972, los directivos de algunas empresas antioqueñas tuvieron la idea de crear una Corporación de Ahorro y Vivienda que se fundó el 14 de Febrero de 1974 con el nombre “Corporación Nacional de Ahorro y Vivienda Conavi”, La primera oficina de Conavi se apertura el 1 de abril de 1974 en el centro de la ciudad de Medellín (Colombia), para el año 2000 se aprobó la conversión de corporación financiera a Banco, y para Abril del 2001 se cambió la denominación y se llegó a llamar “Banco Comercial y de Ahorro”.

Confinsura

Como resultado de la fusión entre la Corporación Financiera Nacional, que prestaba sus servicios desde 1959, y Suramericana S.A, nació Confinsura el 1 de julio de 1993.

Durante cuarenta años de trayectoria, Confinsura logró un buen nombre en el mercado por su amplio conocimiento financiero, empresarial, económico y entorno regulatorio, esta compañía también obtuvo liderazgo y proyección en el sector financiero colombiano por la excelencia y la seriedad en el manejo de sus negocios.

El 14 de septiembre del año 2004 se consideró la idea de unificar las tres compañías líderes en sus actividades en el sector financiero, esto se dio por la decisión que estaba tomando en ese momento su principal accionista, Suramericana S.A.

El propósito de este proyecto consistía en el aprovechamiento de las complementariedades naturales de los tres negocios y la reputación que éstas tenían en el mercado financiero. La integración permitía en su momento formar un solo Banco, más fuerte, con mejores servicios para sus clientes, mayor

Page 24: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

rentabilidad para sus accionistas y nuevas oportunidades de crecimiento para sus empleados.

Finalmente, el 22 de julio del 2005, los principales accionistas de Bancolombia, Conavi y Confinsura aprobaron la unificación de las tres entidades financieras y se contó también con el aval definitivo de la superintendencia Bancaria de Colombia el 22 de julio de 2005.

Para el 30 de julio de ese mismo año, Jorge Londoño Saldarriaga, presidente en ese momento de Bancolombia, Rodrigo Velásquez Uribe, representante de Confinsura y Luis Fernando Muños Serna, representante de Conavi, firmaron ante el notario 29 de Medellín la escritura pública que legalizo la fusión de las tres entidades.

� Bancolombia en la actualidad.

Actualmente Bancolombia cuenta con ocho filiales en el exterior, éstas son:

- Bancolombia Panamá. - Bancolombia Cayman. - Bancolombia Puerto Rico. - Renting Perú. - Leasing Perú. - Valores Bancolombia Panamá. - Fidu Perú. - Banco Agrícola.

Y además de una sucursal en el exterior en Miami (Estados Unidos).

En el siguiente apartado, se darán a conocer algunos aspectos importantes de la situación de Bancolombia en el segundo trimestre del año 2012, información extraída con graficas del informe “EN UN VISTAZO”, que muestra la página Web principal del banco a finales de cada trimestre del año.

Page 25: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Estructura Accionaria (A junio de 2012).

Fuente: Bancolombia, www.grupobancolombia.com, “En un vistazo”, Informe trimestral de la situación actual de Bancolombia del segundo trimestre del año 2012.

Participación de mercado por tipo de negocio (A junio de 2012).

Fuente: Bancolombia, www.grupobancolombia.com, “En un vistazo”, Informe trimestral de la situación actual de Bancolombia del segundo trimestre del año 2012.

Page 26: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

En lo referente a las acciones, actualmente los ADRs de Bancolombia se encuentran listados en la Bolsa de Nueva York (“NYSE”) desde el año 1995, con el símbolo “CIB”, mientras tanto, las acciones nacionales Ordinarias y Preferenciales están listadas en la Bolsa de Valores de Colombia (“BVC”) bajo la denominación “BCOLOMBIA” para las acciones de tipo Ordinaria, y “PFBCOLOM” para las acciones preferenciales.

Grafico 8. Dividendo anual pagado por acción.

Fuente: Bancolombia, www.grupobancolombia.com, “En un vistazo”, Informe trimestral de la situación actual de Bancolombia del segundo trimestre del año 2012.

Principales Indicadores.

Page 27: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Fuente: Bancolombia, www.grupobancolombia.com, “En un vistazo”, Informe trimestral de la situación actual de Bancolombia del segundo trimestre del año 2012.

Bancolombia en estos momentos presenta un número de acciones preferenciales en circulación de 342.122.416, que en porcentajes significa un 40,2% de participación sobre el total de acciones listadas en bolsa, mientras que en acciones ordinarias son de 509.704.584, que en porcentaje representa el 59,8%, para un total de 851.827.000, que equivalen al 100% de las acciones en circulación en el mercado.

Grafico 9. Acción de Bancolombia – IGBC (Entre enero de 2010 a Diciembre de 2011).

Page 28: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Fuente: Bancolombia, www.grupobancolombia.com, Informe De Gestión Empresarial, Año 2011 y Bolsa de Valores De Colombia (BVC).

Grafico 10. Capitalización Bursátil de Bancolombia (Entre enero de 2010 a Diciembre de 2011).

Fuente: Bancolombia, www.grupobancolombia.com, Informe De Gestión Empresarial, Año 2011 y Bolsa de Valores De Colombia (BVC).

Finalmente, como datos recientes extraídos del último informe de gestión del año 2011, se destacan los siguientes:

1.663.894 Millones de pesos fue la utilidad bruta neta del grupo Bancolombia con un incremento del 15,8% frente al año 2010.

Incremento anual de la cartera bruta en un 26,3%.

Bancolombia presentó un incremento bastante grande de los activos totales que aumentaron en 13,5 Billones de pesos.

Bancolombia tuvo un aumento del 25,5% en activos totales durante

el año 2011.

El grupo alcanzo una utilidad anual neta de 1.663.894 Millones de pesos.

Page 29: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Se otorgaron más de 875.500 Millones de pesos en cartera Prestanómina.

Se desembolsaron más de 4 Billones de pesos de cartera de

consumo.

Se incrementó la participación del mercado en un 13,6%.

El total de inversiones netas presento un ascenso del 16,9% frente a la cifra del 2010.

La banca de empresas y gobierno obtuvo un incremento del 19,8%,

esto medido por tamaño comercial (Activos + Pasivos).

Bancolombia obtuvo utilidades netas por 7.841 Millones de pesos, registrando un crecimiento del 71,44% frente al año anterior.

El volumen de colocaciones alcanzo los 2,3 Billones de pesos.

El porcentaje de participación del mercado en crédito de vivienda

de largo plazo se ubicó en el 31,6%.

Se cerraron 453 nuevos negocios, un 75% más que en año 2010.

Son líderes en la colocación de acciones primarias al participar con el 25,8%, cifra equivalente a 3,1 Billones de pesos.

El número total de clientes de Valores Bancolombia a diciembre de

2011 es cercano a los 300.000.

El grupo Bancolombia cuenta con 23.366 empleados.

Según los estudios e investigaciones de marca realizadas por INMARK para el grupo Bancolombia, alcanzaron un Top Of Mind por encima del 40% y una intención de compra del 19%.

Se desembolsaron 1.988 Millones de pesos en Pymes en la línea

de crédito ambiental que hoy son más ecoeficentes.

Page 30: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2. MARCO TEÓRICO E HIPÓTESIS

2.1 MARCO TEÓRICO

El mercado de capitales en Colombia está conformado por diferentes agentes que organizan y estructuran la forma de su negociación; dentro de este mercado se establece como eje fundamental al inversionista, que es el que otorga sus recursos o excedentes de capital para adquirir una utilidad o un retorno, teniendo cuenta los estudios de riesgo, el tiempo de inversión y el submercado o los submercados a los cuales va a ingresar. Este inversionista tiene diferentes alternativas de inversión, dentro de las cuales están: las acciones, los títulos de deuda pública y privada y otras alternativas más complejas como los derivados financieros.

El objetivo de los inversionistas, en cualquier parte del mundo, es obtener grandes beneficios a través de sus inversiones y su perfil de riesgo, este objetivo común hace que los inversionistas y los agentes que intermedian en este mercado, tengan la incertidumbre de si el mercado es eficiente o no, ya que de esta pregunta se deriva la posibilidad de adquirir grandes utilidades, es decir al ser eficiente un mercado, esto nos da a entender que no se le puede sacar un mayor provecho al mismo, mientras que si se determina que es ineficiente, se da la probabilidad de ganarle y obtener grandes beneficios (Fama 1965).

Teniendo en cuenta la importancia de evidenciar si los mercados son eficientes o no, se puede pensar en la posibilidad de diseñar modelos de predicción diferentes a las caminatas aleatorias, las cuales justifican y apoyan la idea de que los mercados son perfectamente eficientes. En apartados posteriores, se presenta una serie de evidencias teóricas relacionadas con este tema.

2.1.1 HIPÓTESIS DEL MERCADO EFICIENTE

La hipótesis de los mercados de capitales eficientes, sostiene que al existir una competencia entre los diferentes inversores que actúan en el mismo mercado, motivados por la ilusión de tener un gran beneficio, genera una situación de

Page 31: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

equilibrio en la que el precio de un activo financiero representa una buena aproximación de su precio teórico, refiriéndose esto, al valor presente de los flujos de caja estimados. Es decir que los activos que circulan en los mercados financieros eficientes reflejan toda la información disponible y ajustan de una forma inmediata la información nueva.

Según Eugene Fama (1965), la razón de que los cambios en los precios y por consiguiente en los retornos sean aleatorios, es debido a que los que participan en este mercado son seres racionales7 y son motivados por la ilusión de ganarle al mercado bajo un ambiente de competencia constante, esto da como resultado que los precios se generen de forma racional, en este caso solamente la nueva información y los nuevos precios producirán variaciones en éstos y la caminata aleatoria será la conclusión definitiva que refleja toda la información disponible actualmente por el mercado.

Fama (1965), resumió esta situación en los siguientes términos:

o Los precios actuales se modificaran rápidamente para ajustarse al nuevo valor intrínseco generado por la nueva información.

o El tiempo que pasa entre dos ajustes continuos de precios de un mismo título es una variable aleatoria independiente.

Bajo esta misma teoría, Harry Roberts (1967), estipuló tres niveles de eficiencia de los mercados de valores, donde cada nivel reflejaba la clase de información que es rápidamente determinada en el precio, estos niveles son conocidos como: débil, intermedio o semi-fuerte y fuerte.

La forma débil de los mercados eficientes indica que no hay relación alguna entre los precios pasados y futuros de los títulos. Es decir, son independientes en el tiempo, como los mercados eficientes muestran toda la información disponible y esta se mueve de forma aleatoria, demuestra como conclusión que es ineficiente la posibilidad de analizar los precios pasados para el pronóstico de los mismos.

La forma intermedia o semi-fuerte de los mercados eficientes, determina que toda la información pública está completamente introducida en el valor del título y por esta razón no se puede utilizar el análisis fundamental para establecer si un título esta infra o supra valorado. Esto quiere decir que cuando una sociedad anuncia algo, los inversionistas de todo el mercado valoran la información con igual velocidad.

7 Un ser racional en términos económicos – financieros, se refiere a la conducta auto-interesada o egoísta de

los agentes económicos no sujetos a criticismos u objeciones éticas para la consecución de objetivos preestablecidos de acuerdo con ciertas reglas preestablecidas.

Page 32: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

En la forma fuerte de la hipótesis, esta profundiza el nivel semi-fuerte de los mercados eficientes, afirmando que los precios reflejan no solo toda la información pública, si no toda la información, esto quiere decir que la llamada información privilegiada se inserta inmediatamente en el valor del título, se toma la idea que en este nivel no se habla de una mercado altamente eficiente si no de un mercado perfecto.

Para el tema objetivo de este trabajo, se profundiza en el estudio y el análisis de la forma débil de la hipótesis de los mercados eficientes.

Para el caso colombiano, algunas evidencias que justifican el uso de modelos matemáticos para la predicción de los índices financieros están demostrados en estudios como el de Montenegro (2007): “Efecto día en la bolsa de valores de Colombia”; Agudelo, Álvarez y Osorno (2009): “Reacción de los mercados Accionarios latinoamericanos a los anuncios Macroeconómicos”; Arrieta, Torres y Velásquez (2009): “Predicción del Comportamiento Diario de la Acción de SURAMINV”; y Villalobos y Mendoza (2010): “Efecto día en el Mercado Accionario Colombiano”.8 Todos estos estudios aportan evidencias cuantitativas y cualitativas al no cumplimiento de la forma débil de la hipótesis de los mercados eficientes en Colombia.

Una de las principales competencias que tiene la teoría de los mercados eficientes, es la teoría de las finanzas conductuales, o en su forma general, la economía conductual, ésta se enfoca en la falta de simetría entre decisiones de adquirir o mantener recursos y la fuerte aversión a las pérdidas o al arrepentimiento, incorporado por decisiones donde algunos recursos emocionalmente valiosos pueden ser totalmente perdidos, adicionalmente indica que la aversión a las pérdidas se manifiesta en la conducta de los inversionistas como una falta de inclinación a vender acciones u otros títulos valores, si haciéndolo puede forzar al vendedor a realizar una pérdida nominal (Genesove y Mayer, 2001), esta teoría pretende ayudar a explicar por qué los precios del mercado de vivienda en estados unidos no se ajustan a la baja hasta el nivel de equilibrio del mercado durante periodos de baja demanda.

Esta teoría aplica la investigación científica en las tendencias cognitivas, emocionales humanas y sociales, para comprender la toma de decisiones económicas y por consiguiente el efecto sobre los precios del mercado de valores.

Existen tres temas principales en la economía conductual y específicamente en las finanzas conductuales:

8 GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a

partir de la técnica de redes neuronales artificiales”, Página 13.

Page 33: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• La heurística: la gente en ocasiones toma decisiones basadas en aproximaciones y no con importantes análisis racionales.

• Presentación: la forma en que un problema o decisión es presentado al decisor puede afectar su acción.

• Ineficiencia en el mercado: los miles intentos de explicar los resultados obtenidos del mercado, los cuales son contradictorios con las expectativas racionales y la teoría de los mercados eficientes. Estos incluyen precios erróneos, toma de decisiones irracionales y beneficios anómalos, citando al señor Richard Thaler el cual ha escrito varios documentos exponiendo anomalías concretas del mercado desde un aspecto conductual.

Algunos modelos de gestión de tesorería y valoración de activos se han generado a partir de esta tesis, dentro de los cuales está el Modelo de Thaler de reacción de los precios ante la información con tres niveles: Infra reacción – Ajuste – Sobrerreacción, creando una tendencia en el precio. Un distintivo de la reacción exagerada o la sobrerreacción, es que el retorno promedio de precios de los activos después de una serie de anuncios de buenas noticias (Análisis Fundamental) es inferior al retorno medio de la raíz de una serie de anuncios de malas noticias, es decir, se genera una reacción exagerada. En conclusión, los activos que fueron ganadores en el pasado no deben ser vistos como un indicador para invertir.

Se cita esta teoría para mostrar una evidencia y una teoría alterna que se esmera por explicar esas anomalías9 que presenta la teoría de los mercados eficientes, esta teoría de las finanzas conductuales no se profundiza en este trabajo, simplemente se da a conocer para apoyar la investigación, el objetivo central de la investigación es construir evidencias cuantitativas que refuten o apoyen la forma débil de la hipótesis de los mercados eficientes, en el caso de una activo financiero colombiano.

9 Se define anomalía en términos generales como una irregularidad o una falta de adecuación a lo habitual,

para este caso son irregularidades o alteraciones a la teoría de los mercados eficientes, que se podrían convertir como evidencia para una teoría que contradiga su postulado.

Page 34: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.2 TÉCNICA DE SERIES DE TIEMPO PARA PREDICCIÓN: MODELOS ARIMA-GARCH.

2.1.2.1 GENERALIDADES DE LOS MODELOS ARIMA-GARCH 10

A consecuencia de las evidencias que se han demostrado sobre la posibilidad de que los precios de un activo financiero podrían explicar su comportamiento futuro, se abre la posibilidad de una metodología que apoya estas hipótesis, se está hablando de la metodología Box-Jenkins.

La metodología Box-Jenkins trae consigo dos descripciones principales, los Modelos Autorregresivos AR(p) y los Modelos de Promedio Móvil MA(q), creados para procesos estocásticos estacionarios univariados11.

Adicionalmente. en algunas series que no presentan un componente de estacionariedad12, se da la necesidad de modificarlas para que se vuelvan estacionarias y sean más fáciles de modelar; es en ésta etapa donde se introduce el factor de diferenciación simbolizado con la letra (I), conformando así el modelo ARIMA, donde (I) significa la integración o el proceso que se hizo para volver estacionaria la serie.

Los modelos ARIMA, fueron promulgados por George Box y Gwilym Jenkins, desde los años 70, pero han sido altamente utilizados desde los años 80.

“La principal desventaja de estos modelos es que la determinación del modelo que mejor se adecua a la serie de datos es trivial y, por tanto, se requiere que la persona que realice predicciones tenga amplios conocimientos sobre esta metodología”13.

El modelo ARIMA es llamado así por sus siglas en ingles que significan Autoregressive integrated Moving Average o en castellano Modelos Autorregresivos integrados de promedios Móviles y se definen Autorregresivos, si

10

Box, George and Jenkins, Gwilim. Time Series Analysis: Forescasting and Control. San Francisco. And Bollerslev, Tim. Generalized Autoregressive Conditional Heteroskedasticity. Journal of Economics. 11

Es un proceso de una secuencia de variables aleatorias ordenadas por un índice de tiempo las cuales tienen unas propiedades estadísticas y probabilísticas que no cambian con el tiempo, para que esta sea más fácil de modelar y tenga posibilidad de hacer predicciones. 12

Una serie es estacionaria si sus propiedades estadísticas y probabilísticas no cambian a través del tiempo, haciéndose más fácil la posibilidad de modelarlo y hacer pronósticos sobre la misma. 13

CARLOS MATE, Modelos ARIMA. Universidad pontificia ICAI ICADE Comillas Madrid. Escuela técnica superior de ingeniería.

Page 35: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

la variable endógena de cierto periodo t es explicada por las observaciones de ella misma, correspondiente a periodos anteriores asociados a un término de error.

El concepto de error de los modelos de éste tipo, está determinado con el nombre de ruido blanco 14, en este se deben cumplir tres hipótesis:

• Media nula • Varianza constante • Covarianza nula entre errores asignados a observaciones diferentes.

En lo que concierne a los promedios móviles MA(q), estos llegan a explicar el valor de una determinada variable en un periodo t en función de un término independiente y una serie de errores pertenecientes a periodos precedentes, ponderados de una manera favorable.

Una extensión de los modelos ARMA (p,q) que pueden explicar series más complicadas de modelar debido a su volatilidad, son los modelos de heteroscedasticidad15 condicional autorregresiva o más conocido con sus iniciales en inglés como modelos ARCH, estos permiten el modelaje condicional de la varianza en lugar de la tradicional estimación incondicional que se hace bajo el supuesto de homocedasticidad16, donde la varianza del error es una constante17.

Posteriormente en el año 1986, Bollerslev generalizo el modelo ARCH, proponiendo que la varianza condicional siga un modelo parecido al modelo ARMA. Este modelo es conocido como.

En la teoría postulada sobre los modelos ARCH, Engle comenta tres situaciones que justifican y apoyan la modelización de la heterocedasticidad condicional autorregresiva:

• Las evidencias empíricas demuestran que en algunas series estudiadas se presenta periodos de amplia varianza de error seguidos por otros de varianza más pequeña.

• Engle promulga la utilización de estos modelos para determinar los criterios de compra o venta de activos financieros, es decir, los agentes económicos e inversionistas toman decisiones en función de la

14

Es una señal aleatoria que se caracteriza por el hecho de que sus valores de señal en dos tiempos diferentes no guardan correlación estadística. 15

Se presenta cuando la varianza de las perturbaciones no es constante a lo largo de las observaciones. 16

Se presenta cuando los errores de un modelo en la variable endógena tiene la misma varianza, (es decir, constante). 17 MONTENEGRO (2009). Series de tiempo. Pontificia Universidad Javeriana. Sexta Edición.

Page 36: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

información del pasado respecto al valor medio de la rentabilidad y la volatilidad que ésta ha presentado.

• El modelo ARCH podría ser una gran herramienta que explicaría un sistema más complejo de datos que no presentan comportamientos homoscedasticos, sino comportamientos heterocedasticos.

La finalidad de estos modelos, está en tener en cuenta la información pasada de las variables estudiadas y sus volatilidades observadas como factor prioritario para la explicación de su comportamiento presente y además de su futuro previsible.

A continuación se presentara como soporte teórico la lista de las diferentes derivaciones que han surgido a partir de la creación de los modelos ARCH a través de la historia:

Tabla 3. Tipos del modelo ARCH-GARCH a través de la historia.

Page 37: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia
Page 38: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Fuente: 20 años de los modelos ARCH: Una visión de conjunto de las distintas variantes de la familia. Rafael de Arce Borda.

2.1.2.2 ESPECIFICACIÓN GENERAL DE LOS MODELOS ARIMA Y GARCH

Sea una serie temporal (��), la expresión del modelo ARMA en su notación algebraica es:

�� = ∁ + ∅ ∙ ��� + ⋯ + ∅� ∙ ���� + � ∙ ��� + ⋯ + �� ∙ ���� + ��

Este modelo se expresa en su forma abreviada como ARMA (p, q).

Como este modelo es lineal, la variable de la serie temporal (��) depende de una constante C, y así mismo depende de valores pasados de la misma variable y de los errores de ajuste correspondientes al pasado.

A la vez también se expresa de forma general el modelo ARIMA de la siguiente manera: �(�) = ∁ + ∅ ∙ ���(�) + ⋯ + ∅� ∙ ����(�) + ∅ ∙ ���(�) + ⋯ + �� ∙ ����(�) + ��(�)

Estos modelos son estructurados en base de los modelos ARMA, pero con la diferencia de que a éste modelo se le hizo un proceso de diferenciación para que la serie estudiada sea estacionaria.

COMP. AUTORREGRESIVO COMP. DE MEDIA MÓVIL

COMP. AUTOREGRESIVO COMP. DE MEDIA MÓVIL

Page 39: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

En su forma abreviada el modelo se expresa como ARIMA (p, d, q) donde ��(�) es

la serie diferenciada en el orden (d) y ��(�) es la serie de los errores que ocurren en la serie anterior.

Para el método de estimación de los modelos ARMA – ARIMA es posible utilizar mínimos cuadrados ordinarios (MCO), asignado a un modelo AR(p), Si el caso es para un modelo MA(q), el método utilizado sería el de máxima verosimilitud; es de aclarar que este último método también sirve para los dos modelos, tanto ARMA como ARIMA.

En la escogencia del estadístico para la elección del mejor modelo se utiliza el SC (Shwartz Criterion), el cual reside en correr el modelo para diferentes valores de p y q buscando la combinación óptima donde los resultados en términos de errores sean mínimos.

Para el estadístico de error que se va a utilizar en la comparación frente al método de redes neuronales artificiales, se escoge el RMSE18.

Enlazados a estos modelos, se encuentran los modelos Autorregresivos condicionales heterocedasticos (ARCH), este modelo permite el modelaje condicional de la varianza en lugar de la estimación incondicional que se hace con el supuesto de homoscedasticidad donde la varianza del error es una constante σσσσ2.

“Se determina un proceso estocástico estacionario como aquella sucesión ordenada de variables aleatorias cuya función de distribución es invariante ante valores igualmente separados”19:

��� �(����, �����, … , ��, ���, … ����) = �(������, �������, … , ����, �����, … ������)

“Para este caso un proceso estocástico es estacionario en su forma débil si cumple con tres condiciones”20:

� E(Yt) = µ, Media constante.

18

Raíz del error cuadrado medio. Error promedio en términos de precios, que es la unidad de medida de la variable de estudio. 19

RAFAEL DE ARCE (1998), Introducción a los modelos autorregresivos con Heterocedasticidad condicional (ARCH). Instituto LR Klein, Pág. 3. 20

RAFAEL DE ARCE (1998), Introducción a los modelos autorregresivos con Heterocedasticidad condicional (ARCH). Instituto LR Klein, Pág. 3.

Page 40: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� Var(Yt) = E(Yt - µ)2 = σ2, o varianza constante

� Cov(Yt; Yt-j) = Cov(Yt+m; Yt+m-j)

Es necesario tener en cuenta la situación del ruido blanco, en las que las tres condiciones se reescribirían de la siguiente manera:

� E(εt) = 0

� Var(εt) = E(εt - 0)2 = σ2

� Cov(εt; εt-j) = 0

En la estructura del ARCH(q), el cuadrado de los errores ��� se postula como: ��� = �� + ����� + ������� + ⋯ + ������� + ��

Donde �� es ruido blanco y tomando como base la expresión anterior se obtiene la

varianza condicional σσσσ2:

�� = !( ������ , ����, ⋯ ) = !( ���"��) = �� + ����� + ������� + ⋯ + �������

Un modelo alterno y más completo que el modelo ARCH es el Modelo Autorregresivo Heterocedastico Generalizado con sus iniciales en inglés GARCH, este proceso fue presentado por Bollerslev (1986), que determina la generalización de los procesos ARCH; El modelo GARCH adiciona una parte autorregresiva al comportamiento de la varianza, planteado en el modelo ARCH.

Page 41: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Así el modelo GARCH (p, q) se podría escribir como:

�� = �� � �� = # + $ ∝&

�&' ���&� + $ �&

�(' �'(�

El orden “p” está asociado a la dependencia temporal de la varianza de la serie con los choques aleatorios al cuadrado ocurridos “p” periodos atrás. Mientras que el orden “q” de la ecuación de la varianza, está asociada a la dependencia temporal de la misma en el periodo “t” al valor que haya tomado en “q” periodos anteriores. Los Yt corresponden a los errores para la ecuación de la media condicional, los cuales dependen de la volatilidad condicional del proceso21.

El postulado del modelo GARCH es sugerido por Bollerslev (1986), con el objetivo de que la varianza condicional siga un modelo similar a un ARMA, es decir el modelo GARCH (p, q) en la cual la varianza condicional tiene la expresión: �� = )� + ) ��� + )� ���� + ⋯ + )� ���� + ����� + ������� + ⋯ + �������

“Donde p es el número de rezagos de la varianza y q el número de rezagos de los errores al cuadrado, en este caso la volatilidad depende de las observaciones anteriores y de las volatilidades anteriores”22.

Una de las principales características de los modelos GARCH es que da la facilidad de modelar con menos términos que los modelos ARCH, utilizando el operador de rezagos L, la ecuación quedaría reducida así: �� = )� + *(+) �� + ,(+)���

Donde A(L) y B(L) son polinomios en L.

21

Pilar Beatriz Alvares Franco, Diego Alexander Restrepo y Fredy Ocaris Pérez (2007), Estudio de efectos asimétricos y día de la semana en el índice de volatilidad “VIX”. Revista Universidad de Medellín, Pág. 7. 22 MONTENEGRO GARCIA ALVARO. Series de tiempo. Páginas 171 y 172

Page 42: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Según Rafael de Arce (1998) indica: “El modelo ARCH (q) puede mostrar ciertas dificultades de estimación cuando se aplica a estructuras dinámicas en los cuadrados de la series. Por ejemplo, en las series financieras, el número de retardos a utilizar es muy elevado y ello llevaría a un engorroso número de iteraciones para alcanzar una solución al sistema planteado, pudiendo darse el caso de no encontrar nunca una solución. Por ello, el mismo Engle propuso ya en 1983 ciertas restricciones a los parámetros del ARCH (1) que simplificaban su estimación; pero estas no eran capaces de recoger cualquier caso, por lo que la aportación de Bollerslev para los modelos ARCH es decisiva a la hora de poder dotar de utilidad al modelo presentado por Engle”.

Verificando esta cita y teniendo en cuenta que el objetivo de esta investigación es sobre una serie financiera, se da la posibilidad de manejar un modelo GARCH (p, q) para modelar la serie de Bancolombia.

Es necesario resaltar que existe un modelo para determinar el efecto ARCH en la serie de datos trabajados, llamada Lagrange o prueba (LM); ésta prueba radica en probar un ARCH(q) contra la no existencia de ARCH, valorando la significancia de los Parámetros del ARCH(q) especificado; y así se determina si hay o no hay efecto ARCH, es decir que en la serie se tenga que explicar o no la volatilidad23.

Bajo el mismo lineamiento, se ha presentado de forma general los postulados de los modelos lineales que se utilizan para el desarrollo de esta investigación, continuando así a una explicación teórica del modelo no lineal que se va a utilizar, el cual se estima dado las relaciones no lineales que puedan existir en las series financieras tal como se cita en los trabajos de Cruz, Iván (2007): “Pronostico en el mercado de derivados utilizando redes neuronales y modelos ARIMA”, Santana, Juan (2006): “Predicción de series temporales con redes neuronales: una aplicación a la inflación colombiana” y entre otros, todo esto para la comparación y medición del desempeño de pronóstico en la acción ordinaria de Bancolombia.

23

GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Página 16.

Page 43: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3 TÉCNICA ARTIFICAL PARA PREDICCIÓN: REDES NEUR ONALES ARTIFICIALES.

2.1.3.1 CONCEPTO DE RED NEURONAL ARTIFICIAL.

Las redes neuronales artificiales son un conjunto de algoritmos matemáticos que relaciona conjuntos de datos no lineales, estas son utilizadas con frecuencia para la predicción de tendencias.

Son denominadas neuronales, por que toman como base fundamental el funcionamiento de una neurona biológica cuando procesan y analizan información.

En las redes biológicas, se reciben los datos por las dendritas que se encuentran conectadas a otras neuronas. Las interconexiones son realizadas por medio de las ramas de salida llamadas Axones , y estás a la vez produce unas conexiones con otras neuronas llamadas proceso sináptico, en conclusión las redes neuronales son sistemas de elementos sencillos que están demasiado interconectados24.

Historia

Dentro de sus grandes acontecimientos están:

� En 1943 Warren McCulloch y Walter Pitts propusieron el clásico modelo de neurona en el que se basan las redes neuronales actuales. Seis años después, en 1949, en su libro The Organization of Behavior, Donald Hebb presentaba su conocida regla de aprendizaje.

� En 1956, se organizó en Dartmouth la primera conferencia sobre Inteligencia Artificial (IA). Aquí, se discutió el uso potencial de las computadoras para simular “todos los aspectos del aprendizaje o cualquier otra característica de la inteligencia”.

� En 1957, Frank Rosenblatt presentó el Perceptrón, una red neuronal con aprendizaje supervisado cuya regla de aprendizaje era una modificación de la propuesta por Hebb.

24

Pablo García Estévez (2002), Documento de trabajo, Aplicaciones de las redes neuronales en las finanzas. Universidad Complutense de Madrid. Facultad de ciencias Económicas y empresariales.

Page 44: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� En 1959, Widrow publica una teoría sobre la adaptación neuronal y unos modelos inspirados en esa teoría, el Adaline (Adaptative Linear Neuron) y el Madaline (Multiple Adaline)

� En los años 60, se propusieron otros dos modelos, también supervisados, basados en el Perceptrón de Rosenblatt denominados Adaline y Madaline.

� En 1962, Rosemblatt publica los resultados de un ambicioso proyecto de investigación, el desarrollo del Perceptrón, un identificador de patrones ópticos binarios, y salida binaria.

Grafico 11. En la parte izquierda, foto de un cumulo de neuronas biológicas en el cerebro humano, micrografía ampliada en 15.000 aumentos. En la parte derecha se muestra un esquema de una neurona.

Fuente: Documento de trabajo, “Aplicaciones de las redes neuronales en las finanzas”, Prof. Dr. Pablo García Estévez, Universidad Complutense de Madrid.

Existen varios significados para explicar el concepto de red neuronal artificial o computación neuronal, hechos por varios autores a través de la historia, dentro de los cuales se tienen los siguientes:

� “Una nueva forma de computación, inspirada en modelos biológicos”.

Page 45: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� “Un modelo matemático compuesto por un gran número de elementos

procesales organizados en niveles”.

� “Un sistema de computación hecho por un gran número de elementos simples, elementos de proceso muy interconectados, los cuales procesan información por medio de su estado dinámico como respuesta a entradas externas. [Hencht – Niesen 88ª]”.

� “Redes neuronales artificiales, son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptivos) y con organización jerárquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico. [Kohomen 88c].”25

Las redes neuronales artificiales son un medio matemático distinto que está permitiendo que procesos más complejos realizados para el ser humano se vuelvan más fáciles para la vida cotidiana.

Este método es muy utilizado en la actualidad debido a su sólida estructura y a la similitud que tiene frente al cerebro, esto quiere decir que posee características como la de aprender de la experiencia, la de sacar aspectos fundamentales a partir de informaciones básicas y la de proponer nuevas salidas a un mismo foco de percepciones, otras ventajas tomadas del libro de José R. Hilera y Víctor J. Martínez (2000) son las siguientes:

� Aprendizaje Adaptivo: Es la capacidad de aprender a realizar tareas basadas en un entrenamiento o una experiencia inicial.

� La autoorganización: Una red neuronal puede crear su propia organización o representación de la información que recibe mediante una etapa de aprendizaje.

� La tolerancia a fallos: La destrucción parcial de una red conduce a una degradación de su estructura, pero esta se puede retener sufriendo daños.

25

Hilera, José y Martínez Víctor, (2000). Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Página 9.

Page 46: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� Fácil implantación a la tecnología ya existente: Es posible obtener Chips especializados para redes neuronales que mejoran su capacidad en algunas tareas, y estos facilitan la integración modular en los sistemas existentes26.

Bajo el mismo tema, se cita al profesor Pablo García Estévez de la Universidad Complutense de Madrid, donde indica: “Desde 1960 varios grupos de investigadores han intentado replicar el esquema de funcionamiento de las neuronas en problemas matemáticos y el resultado ha sido la neurona artificial, ésta recibe información de diferentes fuentes las cuales están representadas por la letra X; Así se tiene desde X1 hasta XN. La información no le llega a la neurona en estado puro, sino que es ponderada debido a que un tipo de información tendrá diferente importancia respecto a otro. Por eso a la información Xi se le multiplica por un peso designado por Wi y por consiguiente si hay N puntos de información, habrá N pesos, uno por cada punto de información. Al llegar a la neurona todos los datos de las informaciones ponderados por sus pesos se suman. Esto es lo que se denomina Regla de Propagación, ésta podría adoptar otro tipo de formas pero la más habitual es la suma de las entradas ponderadas que toma el nombre de potencial sináptico”.

Así mismo se presenta la fórmula del potencial sináptico comentado por el autor:

-&(�) = $ .(/

(' × 1(

Siendo -&(�) El potencial sináptico de la neurona (i) en el momento (t). .( La entrada de datos procedentes de la fuente de información j.

1& El peso sináptico asociado a la entrada Xj.

26

Hilera, José y Martínez Víctor, (2000). Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 11 y 12.

Page 47: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Gráfico 12. Esquema general de una Red Neuronal Artificial.

FUENTE: Construcción propia, Basado en el documento de trabajo “Aplicaciones de las Redes en las Finanzas” del Prof. Dr. Pablo García Estévez, Universidad Complutense de Madrid, Facultad de ciencias Económicas y Empresariales. Madrid, Abril 2002.

Las Redes Neuronales Artificiales son de gran de utilidad en distintas ciencias y disciplinas para el ser humano, de esto se deriva la importancia que tiene estos métodos no convencionales para el progreso y la comprensión de la naturaleza.

Dentro de las disciplinas que abarca la utilización de las redes neuronales artificiales, están las siguientes:

� “En el Medio Ambiente: Para el análisis de tendencias, patrones y previsión del tiempo”.

� “En las fuerzas Militares: Clasificación de las señales de radar, creación de armas inteligentes, optimización del uso de recursos escasos, reconocimiento y seguimiento en el tiro al blanco”.

� “En la Medicina: Para el uso de lectores de rayos X, entendimiento de las causas de los ataques epilépticos, monitorización en las cirugías y el análisis del habla para la ayuda de audición de sordos profundos”.

Page 48: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� “En la Biología: Para la obtención de modelos de la retina”.

� “En las Empresas: Para la optimización de plazas y horarios en líneas de vuelo, reconocimiento de caracteres escritos, explotación de bases de datos y la evaluación de probabilidad de formaciones geológicas y petrolíferas”.

� “En la Manufactura: Para la inspección de la calidad y control de producción en líneas de proceso”.

� “En las Finanzas: Previsión en la evolución de los precios, Valoración del riesgo de los créditos, interpretación de firma s e identificación de falsificaciones” 27.

Como información adicional se presenta los diferentes tipos de redes neuronales que se han inventado o desarrollado a través de la historia, así como se presentó en capítulos anteriores los de la familia de los modelos ARCH:

27

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 21 y 22.

Page 49: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Tabla 4. Tipos de redes neuronales artificiales creadas a través de la historia.

Fuente: Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. Hilera, José y Martínez Víctor.

Page 50: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3.2 ELEMENTOS DE UNA RED NEURONAL ARTIFICIAL 28.

Dentro de los elementos que se pueden encontrar en las Redes Neuronales Artificiales se encuentran:

� Las unidades de proceso : En las unidades de proceso se establecen tres tipos de unidades: entradas, salidas y ocultas, para el caso de las unidades de entrada, estas reciben señales desde el entorno, mientras que las unidades de salida envían la señal fuera del sistema, por último, las unidades ocultas presentan sus entradas y salidas dentro del sistema y éstas no tiene contacto al exterior.

� Estado de activación: El proceso que hace una red neuronal artificial es observada como un progreso de un patrón de activación. Las neuronas que componen la red neuronal están en un estado específico; es posible decir que estas neuronas se pueden encontrar en dos estados de activación: el estado de reposo y el estado de excitación; a estos estados se les asigna un valor específico y estos pueden ser continuos o discretos.

� Función de transferencia: Las neuronas que conforman una red neuronal están relacionadas e interconectadas por una serie de conexiones que las unifican entre ellas, y a su vez esas conexiones trasmiten señales dentro de toda la red, a este tipo de transmisión se le conoce como la función de salida o de transferencia. Existen cuatro funciones de transferencia que establecen distintos tipos de neuronas:

� La neurona de función escalón: Esta consiste en que las salidas de la red son binarias, es decir que solo puede tomar dos valores posibles; la salida de una neurona se activa sólo cuando el estado de activación es mayor o igual que cierto valor umbral.

� Neurona de función lineal: Esta es llamada también función identidad y consiste básicamente en la no utilización de funciones de salida.

28

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 51, 52, 63 y 64.

Page 51: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� Neuronas de función continua (Sigmoidal): Esta se caracteriza porque las salidas son con información analógica, también sirven para cualquier función que este definida en un rango de posibles valores de entrada, con incrementos monotónicos.

� Función de transferencia Gaussiana: Esta función se caracteriza por la adaptación de sus funciones en sus anchuras y centros, y esto la hace más adaptiva que las funciones sigmoidales.

� Conexiones entre neuronas: Las conexiones que conforman una

Red Neurona Artificial tienen asociado un determinado peso, el cual, genera que la red adquiera conocimiento. Estas conexiones surgen cuando se genera una sinapsis entre una neurona de salida que es ponderada por cierto peso asignado, esto quiere decir que la entrada neta o total de señales que recibe una neurona está determinada por la suma del producto de cada señal individual por el valor de la sinapsis que conecta cada neurona; la entrada neta de señales es también conocida como potencial sináptico.

23�( = $ 1(&/& ∙ �&

Dónde:

23�(: Es el potencial sináptico o la entrada neta de señales que recibe una neurona.

1(&: Son los pesos iniciales que ponderan las neuronas i y j.

�&: Es el valor de salida de una neurona i.

Esta regla demuestra la combinación de los valores de entrada con los pesos iniciales de las conexiones, es llamada la regla de propagación .

Page 52: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

� Función o regla de activación: La función de propagación determina la combinación entre las entradas a las neuronas con los pesos de las conexiones, mientras que la función de activación lo que hace es combinar esas entradas con el estado actual de la neurona para producir un nuevo estado de activación. “Dado el estado de activación 4&(�) de la unidad 5" y la entrada total que llega a ella, /3�& , el estado de activación siguiente, 4&(� + ), se obtiene aplicando una función F, llamada función de activación”29. 4&(� + ) = �(4&(�), /3�&) “En la mayoría de los casos, F es la función identidad, por lo que el estado de activación de la neurona en t+1 coincidirá con el Net de la misma en t. En este caso, el parámetro que se le pasa a la función de salida, 6, de la neurona será directamente el Net. El estado de activación anterior no se tiene en cuenta. Según esto, la salida de una neurona & (�&) quedará según la expresión”30:

�&(� + ) = 6(/3�&) = 6($ 7&(/

(' �((�))

29

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 58. 30

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 58 y 59.

Page 53: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 13. Representación gráfica de la función de activación (f) en una red neuronal.

Fuente: Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Página 59.

� Regla de aprendizaje: A nivel biológico se determina que la información memorizada está directamente relacionada con las conexiones sinápticas entre las neuronas que con las mismas neuronas. Para el caso de las Redes Neuronales Artificiales, el conocimiento se encuentra representado en los pesos de las conexiones entre neuronas, y se puede concluir que la red neuronal aprende a medida que se van modificando los pesos de la red.

Page 54: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3.3 CARACTERÍSTICAS DE UNA RED NEURONAL ARTIFIC IAL 31.

Dentro del tema de las redes neuronales artificiales, existen tres parámetros que determinan sus características, estas son:

• Topología: Esta consiste en la arquitectura de la red y determina la organización de las neuronas en el sistema, teniendo esta organización, las partes fundamentales de las redes son: el número de capas, el número de neuronas por capa, el grado de conectividad, y el tipo de conexiones entre neuronas. Al querer clasificar las redes neuronales según su topología, estas se subdividen en Redes Monocapa (con una sola neurona), y Redes Multicapa (con varias neuronas).

Redes Monocapa: Estas están establecidas con conexiones laterales entre las neuronas que constituyen la única capa de la red.

Redes Multicapa: Estas están conformadas de varios conjuntos de neuronas agrupadas en varios niveles o capas. La mayoría de las neuronas de una capa reciben señales de entrada de una capa de neuronas anterior, y estas envían las señales de salida a una capa de neuronas posterior, cercana a la salida de la red neuronal, a este tipo de conexiones se les conoce como conexiones hacia adelante o Feedforward . Pero hay que tener en cuenta que también existen otro tipo de conexiones que permiten enlazar capas posteriores hacia las capas anteriores, a este tipo de conexiones se les conoce con el nombre de conexiones hacia atrás o Feedback.

• Mecanismo de aprendizaje: El aprendizaje es el proceso mediante el

cual una red neuronal modifica sus pesos iniciales de entrada y de salida en respuesta a unos impulsos causados por la información de entrada.

31

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 69, 70 y 71.

Page 55: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Las modificaciones que suceden en el transcurso del aprendizaje finalizan en la destrucción, modificación y creación de conexiones entre las neuronas. Dentro de los mecanismos de aprendizaje se presenta dos tipos de reglas:

Redes neuronales con aprendizaje supervisado: este tipo de redes se caracteriza por que el proceso de aprendizaje se maneja de una forma controlada por una persona externa (Supervisor), el cual establece la respuesta o salida que debería generar la red, de acuerdo a una entrada de información fijada. Para el caso de esta investigación se utiliza este tipo de aprendizaje en el estudio de la acción de Bancolombia. Este tipo de regla de aprendizaje se puede llevar a cabo en tres formas32: - Aprendizaje por corrección de error. - Aprendizaje por refuerzo. - Aprendizaje estocástico.

Tabla 5. Tipos de redes neuronales con aprendizaje supervisado.

Fuente: Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 82.

32

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 75 y 76.

Page 56: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Redes neuronales con aprendizaje no supervisado: Este tipo de aprendizaje no tiene influencia externa para ajustar los pesos de las conexiones de las neuronas, también es llamado como autosupervisado. Este tipo de redes no recibe ningún tipo de información que le dé a conocer si la salida se ajusta de acuerdo a determinada entrada. También tienen la obligación de encontrar las regularidades, correlaciones y características que se puedan determinar entre los datos que se muestren en su entrada. En la utilización de algoritmos, estas redes manejan dos tipos de aprendizaje:

- Aprendizaje Hebbiano. - Aprendizaje competitivo y

cooperativo.

Para el caso del aprendizaje Hebbiano, se intenta medir la familiaridad o sacar características de los datos de entrada, mientras que el aprendizaje cooperativo se enfoca en la clasificación de los datos de la serie estudiada. Otro tipo de enfoque que es posible utilizar para diferenciar las reglas de aprendizaje se fundamenta en establecer si la red puede aprender durante su funcionamiento normal o si el aprendizaje tiene que sufrir una desconexión de la red para que pueda ejecutarlo. Para el caso del aprendizaje durante el funcionamiento se conoce con el nombre de ON LINE, mientras que en el aprendizaje que se desarrolla con la desconexión de la red se le llama OFF LINE33.

33

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 76, 82 y 83.

Page 57: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Tabla 6. Tipos de redes neuronales con aprendizaje no supervisado.

Fuente: Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 89.

• Tipo de asociación hecha entre la información de en trada y la información de salida: El funcionamiento de una red biológica se caracteriza por la recepción de información que adquiere a través de los sentidos, y esta se asocia internamente para dar una salida posible, a esto se le conoce con el nombre de memoria asociativa, para las redes neuronales artificiales existen dos mecanismos de asociación:

Redes heteroasociativas: Posee una función que no es posible expresar de forma analítica entre conjuntos de entradas y salidas de información. Este tipo de redes normalmente utiliza 2 capas, una para captar y retener la información de entrada y otra para mantener la salida de la información estudiada.

Redes autoasociativas: Esta se enfoca en reconstruir determinada información de entrada que se recibe incompleta y distorsionada. La funcionalidad de este tipo de redes se caracteriza por la asociación que presenta

Page 58: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

entre una información de entrada y un ejemplar parecido de información conocida almacenado en la misma red. Para este prototipo de red se puede estructurar con una sola capa de neuronas34.

2.1.3.4 ESTRUCTURACIÓN DE UNA RED NEURONAL ARTIFICI AL 35.

En su mesoestructura, las redes neuronales artificiales están organizadas por:

- Numero de niveles o capas. - Numero de neuronas por nivel. - Patrones de conexión. - Flujo de información.

� Niveles o capas de neuronas: la organización de las neuronas en toda la red están formadas por capas, y estas se pueden conocer de tres tipos:

Capas de entrada: Es la encargada de absorber la información derivada de las fuentes externas a la red neuronal.

Capas ocultas: están inmersas dentro de la estructura de la red y no tienen relación directa al exterior de la red.

Capas de salida: Son aquellas que sacan la información al

exterior de la red, luego de haberse introducido a las capas de entrada y las ocultas.

� Formas de conexión entre las neuronas: Estas se distinguen de la

forma en que las salidas de ciertas neuronas están enlazadas para 34

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 90, 91 y 92. 35

Hilera, José y Martínez Víctor, (2000) Redes Neuronales Artificiales, Fundamentos, Modelos y aplicaciones. (Edición original), Editorial Alfaomega, Páginas 65, 66 y 67.

Page 59: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

convertirse en entradas de otras neuronas. En el caso que la salida de una neurona no sea entrada de otras neuronas, se detecta que la red neuronal es de propagación hacia adelante y cuando las salidas se puedan interconectar a entradas de otras neuronas, se denomina de propagación hacia atrás.

Gráfico 14. Red neuronal de tres neuronas de entrada, cuatro neuronas ocultas y dos de salida.

FUENTE: Construcción propia, Basado en el documento de trabajo “Aplicaciones de las Redes en las Finanzas” del Prof. Dr. Pablo García Estévez, Universidad Complutense de Madrid, Facultad de ciencias Económicas y Empresariales. Madrid, Abril 2002.

Page 60: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3.5 REPRESENTACIÓN MATRICIAL DE LA RED NEURONAL ARTIFICIAL 36.

Para el caso de la estructura de la red neuronal que se ha planteado, de una sola capa oculta, con dos funciones de transferencia, una no lineal y otro lineal, y una neurona en la capa de salida, se expresa de la siguiente manera:

Dada una matriz de datos de .�8� que contiene los datos de entrada de la parte

no lineal, dado un conjunto de datos 1�8� de pesos iniciales, así:

X = 9:;,; :;,< ⋯ :;,=:<,; :<,< ⋯ :<,=⋮ ⋮ ⋱ ⋮:@,; :@,< ⋯ :@,=A y W = BC

D;,; D;,< ⋯ D;,ED<,; D<,< ⋯ D<,E⋮ ⋮ ⋱ ⋮D=,; D=,< ⋯ D=,EFG

En este caso la variable p representa la cardinalidad de cada una de las series de entrada. m el número de variables de entrada del modelo de la parte no lineal, y por ultimo q el número de neuronas de la capa oculta, al realizar la operación de multiplicar las dos matrices, es decir .�8� y 1�8�, surge como resultado la matriz

de potenciales sinápticos H�8�, representada de la siguiente manera:

9:;,; :;,< ⋯ :;,=:<,; :<,< ⋯ :<,=⋮ ⋮ ⋱ ⋮:@,; :@,< ⋯ :@,=A X BC

D;,; D;,< ⋯ D;,ED<,; D<,< ⋯ D<,E⋮ ⋮ ⋱ ⋮D=,; D=,< ⋯ D=,EFG = BCI;,; ⋯ I;,EI<,; ⋯ I<,E⋮ ⋱ ⋮I@,; ⋯ I@,EFG

El siguiente paso, después de tener la matriz resultante H�8�, ésta se debe sumar

con la matriz de los umbrales iniciales ,�8�, y de esta operación, resulta la matriz -�8� , de la siguiente manera:

36

GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Páginas 19. 20 y 21. Aclarando que se manejara una estructura igual en la especificación del modelo de red neuronal utilizado por este autor para los retornos de la acción de ISAGEN, que para el caso de esta investigación, es para los precios de la acción de BANCOLOMBIA.

Page 61: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

BCI;,; ⋯ I;,EI<,; ⋯ I<,E⋮ ⋱ ⋮I@,; ⋯ I@,EFG + BC

J;,; ⋯ J;,EJ<,; ⋯ J<,E⋮ ⋱ ⋮J@,; ⋯ J@,EFG = BCℎ;,; ⋯ ℎ;,Eℎ<,; ⋯ ℎ<,E⋮ ⋱ ⋮ℎ@,; ⋯ ℎ@,EFG

Posteriormente se aplica la función de transferencia 6, para cada uno de los elementos de la matriz H, dando como resultado una matriz de salida ��8�, de la

siguiente manera:

BCL(ℎ;,;) ⋯ L(ℎ;,E)L(ℎ<,;) ⋯ L(ℎ<,E)⋮ ⋱ ⋮L(ℎ@,;) ⋯ L(ℎ@,E)FG = 9M;,; ⋯ M;,EM<,; ⋯ M<,E⋮ ⋱ ⋮M@,; ⋯ M@,E

A

Después de aplicar la respectiva función de transferencia, queda como resultado el vector ��,�, en conjunto con la matriz de los datos de entrada de la parte lineal .�N2∗ , en donde n da a conocer el número de variables de entrada de sección

lineal del modelo general.

Y = 9M;,; ⋯ M;,EM<,; ⋯ M<,E⋮ ⋱ ⋮M@,; ⋯ M@,EA y X = BC

:;,;∗ :;,<∗ ⋯ :;,P∗:<,;∗ :<,<∗ ⋯ :<,P∗⋮ ⋮ ⋱ ⋮:@,;∗ :@,<∗ ⋯ :@,P∗ FG

Estas dos matrices son multiplicadas cada una por el conjunto de pesos sinápticos asignado para la parte lineal representados como: 1�NQ∗ y 12NQ∗∗ , esto, para

determinar el segundo grupo de vectores de potenciales sinápticos, pero en este caso de la parte lineal del modelo, representados como: H�NQ∗ y H2NQ∗ , además se

resalta que el valor de r es igual a uno, esto debido a que la capa de salida está conformada por una sola neurona:

Page 62: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

9M;,; ⋯ M;,EM<,; ⋯ M<,E⋮ ⋱ ⋮M@,; ⋯ M@,EA X BC

D;,;∗D<,;∗⋮DE,;∗ FG = BCI;,;∗I<,;∗⋮I@,;∗ FG

BC:;,;∗ :;,<∗ ⋯ :;,P∗:<,;∗ :<,<∗ ⋯ :<,P∗⋮ ⋮ ⋱ ⋮:@,;∗ :@,<∗ ⋯ :@,P∗ FG X BC

D;,;∗∗D<,;∗∗⋮DP,;∗∗ FG = BCI;,;∗∗I<,;∗∗⋮I@,;∗∗ FG

Después de esto, se hace una operación de suma de las matrices resultantes H�NQ∗ y H2NQ∗ , y además también se suma otra matriz, la cual es el segundo vector

de umbrales ,�N∗ , dando como resultado la matriz -�N∗ :

BCI;,;∗I<,;∗⋮I@,;∗ FG + BC

I;,;∗∗I<,;∗∗⋮I@,;∗∗ FG + BCJ;,;∗J<,;∗⋮J@,;∗ FG = BC

ℎ;,;∗ℎ<,;∗⋮ℎ@,;∗ FG

Inmediatamente después de esta operación se ejecuta la función de transferencia g para cada uno de los elementos del vector -�N∗ , todo esto para obtener el

vector de salida R�N:

BCS(ℎ;,;∗ )S(ℎ<,;∗ )⋮S(ℎ@,;∗ )FG = 9T;,;T<,;⋮T@,;

A

En este caso la matriz Z es el resultado parcial del modelo de la red neuronal propuesta, se aplicara posteriormente un algoritmo de aprendizaje para que se entrene el modelo a través de una serie de iteraciones establecidas por dicho aprendizaje que darán como resultado la predicción de la serie estudiada.

Page 63: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.1.3.6 REPRESENTACIÓN MATEMÁTICA DE LA RED NEURONA L ARTIFICIAL 37.

De acuerdo a la estructura propuesta de la red, la cual está conformada por una capa oculta, dos funciones de transferencia, uno no lineal al inicio y otro lineal al final, además de una capa de salida, es representada de la siguiente manera:

U&,V = 6 WX&,V + $ N&,(�(' 7(,VY ∀& = , �, … , �; � ∀V = , �, … , �.

Donde p representa la cardinalidad de cada serie de datos de entrada, m el número de variables de entrada correspondiente al modelo no lineal, U&,V está

conformado por pxq elementos, resultado de la aplicación de 6 sobre la combinación lineal entre el conjunto de las variables insumo de entrada y el conjunto de pesos iniciales, sumado con la correspondiente restricción.

Después, los pxq elementos de activación, junto con los pxn elementos derivado de la parte lineal de la red, construyen el insumo para activar la capa de salida, la cual está compuesta por una sola neurona, así se obtiene:

]̂&, = _ `X&,∗ + $ N&,a∗2a' 7a,∗∗ + $ �&,V�

V' 7V,∗ b ∀& = , �, … , �. Donde ]̂&, está formado por & elementos de salida, respuesta dada de la

operación de _ relacionada con la suma de:

- La mezcla lineal entre el conjunto �&,V y el vector de los pesos

iniciales 7V,∗ . - La mezcla lineal entre el conjunto de los N&,a∗ y el vector de pesos 7a,∗∗ - Mas una restricción.

Los & elementos están formados después de un número determinado de iteraciones, generado por la aplicación de un algoritmo de aprendizaje.

37

GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Página 22. Aclarando que se manejara una estructura igual en la especificación del modelo de red neuronal utilizado por este autor para los retornos de la acción de ISAGEN, que para el caso de esta investigación, es para los precios de la acción de BANCOLOMBIA, también se tiene en cuenta que las formulas expuestas en este apartado sobre el tema de la representación matemática de la red neuronal propuesta son obtenidas del mismo trabajo citado.

Page 64: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

La variable n es el número de variables de entrada para el modelo lineal, q el número de neuronas de la capa oculta, para el caso de f y g, estos son dos funciones de activación que establecen algunas restricciones de acotamiento al modelo.

2.1.3.7 DESVENTAJAS DE LAS RNA.

Dentro de las utilidades y beneficios que poseen las RNA, se deben tener en cuenta algunas desventajas que presenta en su metodología y su forma de uso, dentro de ellas se encuentran:

La falta de hardware, debido a que la capacidad de las RNA radica en su habilidad de procesar información en paralelo, es decir, procesar múltiples pedazos de datos simultáneamente y por ello, modelar procesos paralelos podría ser un proceso que consuma mucho tiempo (Costo computacional).

Otro inconveniente que presenta las RNA, son la falta de reglas determinantes que ayuden a construir una red para un problema específico; existen muchos factores a tener en cuenta como la regla de aprendizaje, la arquitectura, el número de neuronas por capa, el número de capas y la representación de los datos.

Existe un término en el tema de las RNA conocido como “LA CAJA NEGRA”, que se establece como una desventaja, ya que cuando se modela en estadística se tiene la capacidad de ver que variables forman parte del modelo o cuales han sido seleccionadas de las que introdujeron inicialmente, en este proceso se puede ver la escogencia de esas variables, el proceso detallado y la ecuación final, aspecto que no es posible en las RNA38.

38

Ing. Bruno López Takeyas, (2005) Inteligencia artificial, Redes neuronales, Instituto Tecnológico Nuevo Ladero, México.

Page 65: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

2.2 HIPÓTESIS DE LA INVESTIGACIÓN.

Hay diferentes trabajos que evidencian la existencia de anomalías en la teoría de los mercados eficientes, estas anomalías pueden llegar a refutarla, y adicionalmente podrían llegar a conformar una nueva hipótesis donde se determine que el comportamiento de los activos financieros si se puede llegar a predecir a partir de comportamientos históricos o de otro tipo de métodos matemáticos más avanzados, contradiciendo la hipótesis de los mercados eficientes en su forma débil.

En consecuencia, se afirma que la técnica de Redes Neuronales Artificiales es más eficiente en la predicción de los precios de la acción de Bancolombia, que los modelos ARIMA-GARCH propuestos por Box-Jenkins en los años 70, Engle (1982) y Bollerslev (1986) respectivamente, esto debido a que las RNA presentan ventajas más sólidas en el proceso como el aprendizaje adaptivo de la información y la autoorganización de datos.

3. MODELAMIENTO PARA LA PREDICCIÓN.

El desarrollo de ésta investigación se basa básicamente en el pronóstico de los precios de la acción ordinaria de BANCOLOMBIA ; se evalúa el desempeño de dos modelos matemáticos, uno fundamentado en la Econometría de las series de tiempo con el nombre de modelos ARIMA-GARCH que de acuerdo a sus análisis, plantea un pronóstico soportado en la linealidad de los datos de dicha serie, por otro lado se tiene el modelo de las Redes neuronales Artificiales o RNA, que propone un pronóstico a partir de una análisis de no linealidad con los datos de la serie de BANCOLOMBIA, todo esto, para que al final se pueda establecer cuál es el modelo que mejor puede proyectar los precios de este activo y así tomar decisiones de inversión acertadas en el futuro.

Bajo el proceso de esta investigación se tomó una muestra de 3.075 datos diarios del precio de cierre de la acción de BANCOLOMBIA, entendidos entre el 13 de marzo del año 2000 hasta el 30 de diciembre de 2011, extraídos de la página Web del Grupo Aval.

Page 66: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Bajo el mismo tema se inicia por el análisis de los datos históricos de la serie en lo que se refiere a precios de cierre y rentabilidades.

3.1 ANÁLISIS DE LA SERIE HISTÓRICA DE LOS PRECIOS D IARIOS DE LA ACCIÓN DE BANCOLOMBIA.

En la gráfica 15 se puede observar la evolución que ha tenido la acción a través del tiempo, pasando por la crisis financiera mundial del 2008 y 2009, ésta fue provocada enormemente por la crisis hipotecaria en los Estados Unidos y ésta a la vez se transmitió a varios países ocasionando una crisis económica global, Colombia fue afectada de forma directa y se reflejó a través de sus indicadores económicos como el consumo y el desempleo, también se destaca la reducción de las exportaciones colombianas, generada por la crisis de sus dos principales socios comerciales, Estados Unidos y Venezuela, uno deriva su crisis a la contracción de su PIB y el otro a la reducción de los precios del petróleo, esto afecto gravemente al país y sus exportaciones decrecieron, de pasar de un 11.4% en el año 2007 al 8.1% en el 2008, según publicación del DANE. Estos datos representan el objetivo de estudio de esta investigación, para los cuales se presenta periodos de alta bursatilidad e incremento y periodos de baja Bursatilidad y de calma. Es decir, entre los años 2000 al 2006 hubo un incremento sostenido, para el periodo comprendido entre el 2007 y 2009, este permaneció sin aumento y tampoco hubo bajas significativas, por último, para el periodo observado entre el 2010 al 2011, este volvió a incrementarse sostenidamente.

Para el caso de los retornos, observados en la gráfica 16, se puede evidenciar la presencia de periodos de alta volatilidad, como el rango comprendido entre el año 2001 al 2009 y seguidos de rangos de periodos de baja volatilidad o tranquilidad después del año 2009 hasta principios del año 2011, permitiéndonos determinar que la acción colombiana, en lo que se refiere a retornos, es muy volátil, característica fundamental de la mayoría de las series financieras en todo el mundo.

Page 67: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 15. Datos de los precios diarios de la acción de Bancolombia (Entre Marzo de 2000 a Diciembre de 2011).

Grafico 16. Datos de los retornos diarios de la acción de Bancolombia (Entre Marzo de 2000 a Diciembre de 2011).

VOLATILIDAD

INCREMENTO

Page 68: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

3.2 MODELOS ARIMA Y GARCH.

3.2.1 DIVISIÓN DEL CONJUNTO DE DATOS.

Para el inicio de la modelación de la serie de los precios de la acción de BANCOLOMBIA, por medio de los modelos econométricos ARIMA y ARIMA- GARCH, se divide el conjunto total de los precios diarios en dos subconjuntos, el primer subconjunto está formado por 2.768 datos diarios de los precios de la acción (el 90% de los datos totales), para estimar el modelo, y el segundo está conformado por 307 datos diarios del precio de las acciones (el 10% de los datos totales) para la evaluación y el pronóstico del modelo.

3.2.2 PRUEBA DE ESTACIONARIEDAD DE LA SERIE.

Para el proceso de estudio, primero se verifica si la serie de los precios de la acción de BANCOLOMBIA, desde este momento llamada la variable (PREDBANCOL), es estacionaria o no, según lo afirmado por Montenegro (2009), donde indica que: “Cuando una serie estacionaria se acerca a su límite superior o inferior, debe haber algún mecanismo que tienda a devolverla, haciendo que el próximo movimiento o cambio sea hacia su media; esta reversión hacia su media será más fuerte cuanto más lejos este la serie de la medida. Una prueba bastante común sobre estacionariedad, que incorpora este principio de reversión a la media es la prueba de Dickey Fuller Aumentada (ADF)”; Aunque existen otras pruebas que también pueden evaluar la estacionariedad de la serie; según lo indicado por Antunez Cesar en su documento “Pruebas de raíces unitarias en Eviews” (2010) donde detalla la prueba de Phillip Perron: “ésta prueba a diferencia de la prueba ADF indica que no existe termino de diferencia retardada y además éste test utiliza métodos estadísticos no paramétricos para evitar la correlación serial en los términos del error, sin añadir términos de diferencia rezagada en la ecuación, otra prueba altamente utilizada es la prueba KWIATKOWSKI, PHILLIPS, SMICHTD Y SHIN (KPSS), donde los autores proponen contrastar como hipótesis nula la hipótesis de estacionalidad en tendencias y donde radica las principales diferencias con las anterior prueba de raíz unitaria”.

Ya realizada esta prueba ADF (Evidencia número 1 del anexo 1), se demuestra que la serie PREDBANCOL es no estacionaria en primera instancia, ya que con un nivel de significancia del 5%, es necesario realizar una diferenciación para

Page 69: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

volverla estacionaria (Evidencia número 2 del anexo 1); al confirmar que la serie se encuentra estacionaría, se rechaza la hipótesis nula de que la serie tiene una raíz unitaria, por consiguiente, se concluye que la serie a predecir cumple con el supuesto de estacionariedad, en lo cual permite proponer y estimar un modelo ARIMA.

3.2.3 ESTIMACIÓN DEL MODELO ARIMA Y REALIZACIÓN DE LA PRUEBA ARCH-LM.

Posteriormente, se comienza a proponer el modelo ARIMA que mejor se ajusta al comportamiento de la serie de datos estudiada, después se guardar el termino de

error (�̂�), los cuales presentan un comportamiento de ruido blanco, luego se

estudian los errores al cuadrado (�̂��), a través del estadístico Q, el cual se podría verificar correlación serial, si se determina que existe correlación serial, se aplica en primera instancia el test ARCH-LM para determinar si existe o no efecto ARCH, para el caso de que exista efecto ARCH, se procede a plantear el modelo GARCH que mejor se ajuste a los datos estudiados.

3.2.4 ESPECIFICACIÓN DEL MODELO ARIMA.

A través de la observación de los correlogramas de las funciones de autocorrelación parcial y de autocorrelación (Evidencia 3 del anexo 1), se comienza la estimación de distintos modelos ARIMA, para elegir el que mejor explique el comportamiento de la serie de los datos, después de haber realizado este proceso, se obtiene como resultado el siguiente modelo ARIMA (Evidencia 4 del anexo 1): ( + �, �c�d�c, + �, e�cfcd,d − �. ehf,d)]� = ( + �, d�ife, + �. didjji,d)��

Representación en términos de R�:

Page 70: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

R� = −�, �c�d�cR�� − �, e�cfcdR��d + �, ehfR��d + �, d�ife���+ �, didjji���d + ��

Este resultado es la mejor estimación calculada y obtenida bajo el proceso de esta metodología, este resultado cumple con el test de los inversos de las raíces del polinomio característico y el test del estadístico Q sobre los residuos del modelo (Evidencias 5 y 6 del anexo 1).

3.2.5 ESPECIFICACIÓN DEL MODELO ARIMA-GARCH.

Con el modelo ARIMA obtenido, se estudiaron los �̂�� a partir del estadístico Q (Evidencia 7 del anexo 1), de la cual se concluye que existen evidencias de una posible correlación serial, es por eso, que se realizó el test LM, para verificar si se encuentra presente el efecto ARCH (Evidencia 8 del anexo 1), al realizar este test, se establece que si existe presencia del efecto ARCH en la serie de los residuos al cuadrado.

Para poder introducir el efecto ARCH al modelo, se estiman distintos modelos ARIMA-GARCH, primero se utiliza el modelo con los errores distribuidos de forma normal para evaluar la evolución que presenta la predicción en la comparación del coeficiente calculado por medio del RMSE y se analizan otros modelos con una distribución de los errores t-student y otros más, con una distribución generalizada del error (GED39), los cuales sirven para distribuciones de error de colas pesadas o gruesas como algunos autores las llaman; todo este procedimiento justificado por la metodología utilizada por Ospina y Giraldo (2009), en el documento de trabajo “Aplicación de los modelos GARCH a la estimación del VAR de acciones colombianas” de la revista soluciones de postgrado EIA de Medellín (Colombia).

Después de haber realizado este procedimiento, se obtienen los siguientes modelos:

39

Generalized Error Distribution (GED): Distribución muy flexible que puede obtener varias formas dependiendo de sus parámetros.

Page 71: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

GARCH (1,2) Ajustados los errores con una distribución Normal (Evidencia 9 del anexo 1):

�� = �. deef + �. ddif����� + �. eh�i ��� + �. e�d�j ����

Dando como resultado, la nueva especificación del modelo auxiliar ARIMA, de la siguiente forma:

( − �. ehccj, + �. fe�i�,d)]� = ( − �. ehje, + �. fhfhh,d)��

GARCH (1,2) Bajo una distribución de errores t-student (Evidencia 10 del anexo 1):

�� = j�f�f. di + hh�. ��d���� + �. jjjc� ��� + �. d�i�i� ����

Dando como resultado, la nueva especificación del modelo auxiliar ARIMA, de la siguiente forma:

( − �. idid�,d)]� = ( − �. �. id�che,)��

GARCH (1,1) Bajo una distribución generalizada de los errores (GED) (Evidencia 11 del anexo 1):

�� = ecceh. je + dd. if�i���� + �. ec��h ���

Dando como resultado, la nueva especificación del modelo auxiliar ARIMA, de la siguiente forma:

( + �. �f�j��, − �. ��i��h,d − . i! − �i,d)]� = ( + �. �f�j��, − �. ��i��h,d)��

Page 72: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Estas son las mejores estimaciones halladas a través de esta metodología.

3.2.6 EVALUACIÓN Y ELECCIÓN DEL MEJOR MODELO ARIMA-GARCH.

En este apartado, se evalúan las cuatro estimaciones de los modelos realizados: ARIMA, ARIMA-GARCH (Con distribución de errores normal) conociendo de antemano que es rechazada la hipótesis nula de que los errores se comportan como una normal, pero se presenta con el objetivo de ver la evolución del coeficiente RMSE, y como éste es más pequeño a medida de que se establecen otros modelos que tiene mejor desempeño en el pronóstico; es el caso, del ARIMA-GARCH (Con distribución de errores t-student) utilizada para colas más pesadas y ARIMA-GARCH (Con distribución GED), también para distribuciones de error de colas gruesas, teniendo en cuenta que la metodología a utilizar para la elección del mejor modelo, es hacer una suposición de cada una de las distribuciones para proponer el modelo GARCH, después pronosticar con cada uno de ellos y por último verificar con el estadístico de error RMSE, cual es el que presenta mejor desempeño y así compararlo con el coeficiente RMSE del modelo de la RNA Autorregresiva más eficaz. Asimismo, se debe indicar que para establecer los modelos GARCH con distribución de error normal y distribución de error t-student, se tuvo que modificar40 el modelo original planteado en el ARIMA y aplicarlo posteriormente, para el GARCH con distribución GED, no fue necesario hacer ésta transformación.

Tabla 7. Resultado de los desempeños fuera de muestra (subconjunto de test) de los modelos ARIMA-GARCH (Evolución).

40

El término “modificar” se refiere al cambio que se tuvo que hacer del modelo ARIMA en sus variables planteadas inicialmente, es decir los AR y los MA que se tuvieron que quitar o colocar para proponer el modelo GARCH para cada una de estas distribuciones de error.

Page 73: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Al realizar la respectiva comparación de los resultados de los modelos propuestos, se demuestra la evolución que presenta el ajuste de los errores a distribuciones con colas más gruesas que la normal y se determina como mejor modelo lineal para el pronóstico, el ARIMA-GARCH, con la distribución generalizada de los errores (GED), por ser el de menor coeficiente RMSE en relación con los demás modelos propuestos.

3.2.7 PRUEBA DE NO LINEALIDAD SOBRE LA SERIE DE PRE CIOS.

Es necesario emplear la prueba BDS para fundamentar el uso del modelo basado en las redes neuronales; esta prueba determinará si hay soporte estadístico de la presencia de una relación no lineal entre la variable dependiente PREDBANCOL y las variables independientes.

La prueba BDS fue postulada por Brock, Dechert, Sheinkman y Lebaron (1996), está estructurada bajo la hipótesis nula de que una determinada serie temporal es independiente e idénticamente distribuida (iid), frente a una hipótesis alternativa donde la serie temporal no es independiente e idénticamente distribuida (no iid). Esto quiere decir, que para cualquier par de puntos de la serie, .� y .a, será correcta la siguiente igualdad de probabilidades41. -�: l� = l� ; -: l� ≠ l�

Es decir: -�: N �(&. &. �)

l(|N� − Na| < p, |N�� − Na�| < p, … |N��� − Na��| < p) = l(|N� − Na|)�

Donde � < p < qás(N) − �í2(N) u � > 0

41

GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Página 28 y MONTENEGRO (2005). Op. Cit. Página 65.

Page 74: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Es por esta razón, que se propone este test como un método indirecto para estudiar detalladamente la no linealidad de la serie; al verificar el resultado de esta prueba, si éste rechaza la hipótesis nula, sobre los datos que se analizan, se supondrá que la estructura no iid tendría que ser no lineal.

Usada la prueba BDS (Evidencia 13 del anexo 1) se determina que existe soporte estadístico para certificar que existe una relación no lineal entre las variables independientes del estudio y la variable dependiente (PREDBANCOL), con un nivel de significancia del 5%, por tal razón se continua con la estimación de los modelos basados en Redes Neuronales Artificiales, con el propósito de capturar esta relación no lineal que no logro capturar el modelo ARIMA-GARCH con mejor desempeño.

3.3 MODELO DE RED NEURONAL ARTIFICIAL.

El objetivo principal de esta investigación, es buscar el mejor pronóstico de los precios de la acción de Bancolombia y para este apartado se hace a través del modelo no lineal de las Redes Neuronales, donde se propone un modelo RNA autorregresivo, éste es constituido por la colocación de series de rezagos de los precios de Bancolombia en el conjunto de variables explicativas, después de la aplicación de este modelo en los datos, se analizan los resultados del pronóstico para establecer el mejor modelo en predicción (Subconjunto de test) y compararlo con el mejor modelo ARIMA-GARCH calculado.

3.3.1 ESPECIFICACIONES DE LA RED NEURONAL ARTIFICIA L.

En los apartados siguientes se describe el contexto de la aplicación del modelo de RNA de la siguiente manera: (A). El modelo de RNA utilizado para la realización de este trabajo de investigación; (B). la forma de la subdivisión de los datos de entrada de la red; (C). El algoritmo de aprendizaje de la red y (D). El algoritmo utilizado para la inicialización de los pesos y la matriz de umbrales.

Page 75: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

3.3.1.1 CARACTERÍSTICAS DEL MODELO RNA DE LA INVESTIGACIÓN42.

En primer lugar, para el proceso de esta investigación se genera una red neuronal artificial de forma supervisada, justificada por el hecho de tener una variable objetivo que para el caso de este trabajo son las predicciones de los precios de la acción de Bancolombia. En una visión general lo que se pretende con este tipo de red es cotejar la salida de pronóstico del modelo con los datos reales que no se incluyeron en el entrenamiento del modelo.

En lo que se refiere a la estructura de la red, esta es de tipo multicapa con una sola superficie oculta (Single hidden layer) y con alimentación hacia adelante (feedforward) y una sola neurona en la capa de salida.

La red estará conformada con una superficie de entrada, donde se introducen los vectores con la información preliminar tanto lineal y no lineal de la serie de datos. Se recalca que dentro de la estructura existen dos capas, una oculta y una de salida, donde se procesa y se analiza toda la información.

El modelo de la red está conformado por dos grupos de datos, uno lineal y otra no lineal, el primero compuestos por todas aquellas variables que explican la variable objetivo de forma lineal y el segundo es nutrido por todas aquellas variables que explican la variable objetivo de forma no lineal.

Grafico 17. Estructura del modelo de red neuronal artificial para el pronóstico de la acción de Bancolombia.

Fuente: García, Carlos Mario, (2012) “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Página 30.

42

GARCÍA, CARLOS MARIO, “Predicción del comportamiento de la rentabilidad de la acción de ISAGEN, a partir de la técnica de redes neuronales artificiales”, Página 30. Aclarando que se manejara una estructura igual en la especificación del modelo de red neuronal utilizado por este autor para los retornos de la acción de ISAGEN, que para el caso de esta investigación es para los precios de la acción de BANCOLOMBIA.

Page 76: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Uno de los principales fundamentos para la utilización de una red multicapa con una sola superficie oculta (Single hidden layer) es basada en la explicación que hace ISASI y GALVAN (2004) en su documento de trabajo titulado “Redes neuronales Artificiales, Un enfoque práctico” donde dice: “Un número excesivo de unidades ocultas puede llegar a conducir a una escasa capacidad de generalización de la red, lo que significa, en este caso, que la red tiende a ajustar con mucha exactitud los patrones de entrenamiento, lo cual no permite que la red extraiga la tendencia o las características del conjunto de entrenamiento”, esto da a entender que un modelo RNA con varias unidades ocultas puede llegar a afectar la capacidad de predicción del modelo.

En la representación de la RNA propuesta, ésta es basada en el trabajo de grado de GARCÍA, CARLOS MARIO (2012), donde se denota a m como el número de variables de entrada que conforman los insumos de información de la parte no lineal, como c el número de capas ocultas y con qc el número de neuronas en cada una de las capas c, también es importante tener en cuenta el número de capas ocultas, que para este caso es igual a 1, y esto da a entender que las distintas arquitecturas que se propongan estribarán de la combinación entre m y q. para este caso se plantean algunas arquitecturas, se analiza su capacidad de predicción dentro y fuera de muestra, a través de un estadístico de prueba y por último se verifica cual es el modelo que más se aproxima al pronóstico de la serie estudiada.

Para el caso de poder establecer el número óptimo de neuronas en la capa oculta, es decir la equivalencia de q, esta es justificada por la opinión de Isasi y Galván (2004) la cual indica: “Si bien el número de neuronas ocultas puede influir en el comportamiento de la red –capacidad de generalización, es necesario indicar que en el caso de una red multicapa, generalmente el número de neuronas ocultas no es parámetro significativo, pues dado un problema, puede existir una gran cantidad de arquitecturas capaces de resolver de manera adecuada dicho problema. Además, añadir o eliminar una neurona oculta no influye, de manera significativa, en la capacidad de la red”. Debido a estas evidencias y al esquema propuesto por el profesor Carlos Mario García en su tesis no publicada para la acción de ISAGEN, se establece procesar los valores de q entre 1 a 5 neuronas.

Para el caso específico de las funciones de activación, se escogen de forma arbitraria la Tangente Sigmoidea para la parte de la capa oculta, mientras que para la capa de salida se utiliza una función lineal o identidad; para la regla de propagación se usa la de la suma de todas las entradas de forma ponderada.

En definitiva, queda en su totalidad conformada la Red Neuronal Artificial con la gráfica siguiente:

Page 77: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 18. Estructura del modelo de Red Neuronal Artificial propuesto.

Para este caso m es el número de variables que está conformado por el grupo de datos de la sección no lineal (X) en el gráfico, q está simbolizada para representar el número de neuronas de la capa oculta, la matriz IWi,j representa los pesos entre la capa de salida i y la capa oculta j, la matriz b, está conformada por los umbrales iniciales de cada una de las capas, y por último la matriz KW i,j está representada por el conjunto de pesos entre la capa de entrada j, y la capa oculta i.

3.3.1.2 DIVISIÓN DEL CONJUNTO DE DATOS.

El grupo total de la serie de datos se trabaja en tres subconjuntos de la siguiente manera:

� 2.307 datos para el entrenamiento del modelo que equivale al 75% de los datos totales de la serie.

� 461 datos para la validación del modelo que equivalen al 15% de los datos totales de la serie.

� 307 datos para el pronóstico del modelo que equivalen al 10% de los datos totales de la serie.

Es necesario aclarar que los subconjuntos de entrenamiento, validación y test, están constituidos por la división de los datos para las variables de entrada

Page 78: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

(imputs) y el conjunto de variables de salida (output), conformada por los precios de la acción de Bancolombia.

Adicionalmente, la justificación de la utilización de esta subdivisión es basada en las recomendaciones de Montenegro (2009), donde indica: “Una vez se tiene estimado el modelo, es común usarlo para ver que tan bien hubiera predicho las observaciones de la muestra. Sin embargo, como al efectuar la estimación el modelo se ajusta lo mejor posible a la muestra, entonces probar su capacidad predictiva en la misma muestra tiende a producir resultados demasiado optimistas. Infortunadamente, esta advertencia es ignorada con frecuencia. El método de validación cruzada (cross validation) consiste en utilizar una parte de la muestra para estimar el modelo y otra parte para evaluarlo; por ejemplo, usar el 75% de las observaciones para estimar y el 25% restante para probar y evaluar”.

Debido a esto y a la subdivisión que se presentó para el modelo ARIMA-GARCH se toma la decisión de subdividirlo de esta manera para el modelo RNA.

3.3.1.3 SELECCIÓN DE PESOS Y UMBRALES INICIALES.

Para la selección de los pesos y los umbrales iniciales, éste se basa en el algoritmo Nguyen-Widrow, teniendo como objetivo, encontrar un mínimo local bastantemente bueno. Es importante resaltar la importancia de la inicialización de los pesos y los umbrales iniciales, ya que estos afectan de manera directa en el resultado del mínimo valor de la función objetivo y en la rapidez en la que procese hacia éste resultado.

Una evidencia de (Traducido de Franses & Van Dijk), (2000) citada en la tesis no publicada del profesor García, Carlos Mario, indica explícitamente que “La suma de los cuadrados de la función E(x), es conocida por poseer muchos mínimos locales. Por lo tanto, si el algoritmo de estimación converge, no se puede garantizar que se haya obtenido el mínimo valor de la función objetivo. Un método comúnmente aplicado para mejorar las posibilidades de encontrar el mínimo valor de la función objetivo, es el de estimar la RNA en varios momentos, utilizando diferentes valores de partida x(0), y luego elegir las estimaciones que alcanzan el valor mínimo de E(x)”. Fundamentados en esta afirmación se toma la decisión de realizar 25 estimaciones por cada una de las arquitecturas propuestas con la inicialización θ(0), con distintos valores de pesos y umbrales iniciales con el algoritmo anteriormente dicho en el inicio de este apartado conocido como Nguyen-Widrow.

Page 79: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

3.3.1.4 SELECCIÓN DE LAS VARIABLES QUE AYUDAN A EXPLICAR EL MODELO RNA DE ESTE TRABAJO.

Para el caso de la asignación de las variables de explicación del modelo de la RNA autorregresiva, de acuerdo a la opinión de algunos expertos en el tema, indican que es sensato tomar como base un mes bursátil, es decir unos 20 días hábiles, y así se seleccionan los 20 rezagos que se van a analizar para escoger los que mejor expliquen la serie en el futuro.

Después de la inclusión de los 20 rezagos, se continúa con la ejecución de la metodología Stepwise , para determinar el conjunto de variables explicativas y además determinar un orden de inclusión de estas al modelo.

Subsiguientemente, se construyen los dos conjuntos de las variables Inputs, para este caso, el grupo lineal X* y el grupo no lineal X, los cuales serán los insumos del modelo, éstos se sitúan en la superficie de entrada y se construyen así:

El conjunto de la sección lineal X* se forma a partir de la metodología Stepwise postulada por Swanson & White (1995).

Esta metodología se inicia con una regresión lineal cuya variable dependiente es PREDBANCOL, y como posibles variables explicativas, se estudian los primeros 20 rezagos de la variable.

Para este caso donde se maneja una RNA autorregresiva, se toman como rezagos significativos de la acción de Bancolombia los siguientes:

Precio histórico de la acción de Bancolombia rezagado:

� Un periodo PREDBANCOL(-1) � Tres periodos PREDBANCOL(-3) � Nueve periodos PREDBANCOL(-9)

Por medio de esta metodología también es posible adquirir el orden de entrada de las variables al modelo RNA, esto es derivado de la capacidad explicativa de cada variable, el cual es manejado como criterio para la inclusión paso a paso de las variables en la selección del conjunto no lineal X en los inputs de entrada.

La sección no lineal X, posee un distintivo particular en esta investigación, ya que éste es construido y formado a través de la sección lineal del modelo X*.

Page 80: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Lo que se quiere dar a entender es que el grupo de variables explicativas para la parte no lineal del modelo, se determina a partir del grupo de variables que ya está anticipadamente conformado para la sección lineal, por consiguiente se busca establecer si alguna de estas variables, además de explicar la variable dependiente de forma lineal, también afecta esta misma variable de forma no lineal.

La selección de las variables en la sección no lineal del modelo de Redes Neuronales Artificiales es procesada de la siguiente manera:

1. Se elige la primera variable del grupo lineal X* (sección lineal), y para ese momento m (número de variables explicativas que constituyen la parte no lineal del modelo) es igual a 1, esta primera variable se forma como el conjunto X (Sección no lineal); posteriormente se corre el modelo de RNA, cambiando el valor de q (número de neuronas) para q = 1, 2, 3, 4 y 5 y por último se calculan los distintos estadísticos de error de pronóstico.

2. Es seleccionada la primera y la segunda variable del grupo lineal X*, para este instante m es igual a 2, estas dos variables se conforman como el conjunto X; posteriormente es ejecutado el modelo de RNA variando el valor de q para q = 1, 2, 3, 4 y 5 y se calculan el estadístico de error de pronóstico RMSE.

3. Sucesivamente se sigue adicionando una nueva variable hasta que m

sea igual a n (donde n es el número de variables de entrada que conforman el grupo de datos de la sección lineal X*) para ese momento, las n variables conformarían la sección no lineal del modelo; después de esto se corre el modelo de RNA variando el valor de q para q = 1, 2, 3, 4 y 5 y por último, se calcula el estadístico de error de pronóstico anteriormente dicho para cada combinación.

De esta forma es construido el conjunto de datos de la sección no lineal del modelo, con t variables, donde t tiene que ser menor o igual a n, y para este caso X es un subconjunto sacado de X*, éste conjunto es formado por todas las variables que ayudan a explicar de manera no lineal a la variable objetivo PREDBANCOL.

Page 81: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

3.3.1.5 SELECCIÓN DEL ALGORITMO DE APRENDIZAJE.

La función de aprendizaje o también llamado algoritmo de aprendizaje, es el proceso mediante el cual se van modificando todos los parámetros de la Red Neuronal, para este caso, donde se elige un tipo de aprendizaje supervisado, las transformaciones de los parámetros se ejecutan buscando que la salida de la Red sea la más óptima al patrón de salida deseado.

Debido a esta estructura de aprendizaje propuesta, este aprendizaje se establece como un problema de minimización, queriendo como resultado o como función objetivo la suma de los errores al cuadrado de la siguiente forma:

�&2 ! ; z{|I} ! = $~�� − �(N�, ��)��2�'

Donde �� es el vector de salidas deseadas, �(N�, ��) es el vector de salidas de la

red, N� es el vector de inputs, �� es el vector de pesos y umbrales, y por último 2 es el número de patrones o muestras.

Así se concluye que de acuerdo con la afirmación de ISASI y GALVAN (2004), “Si �∗ es un mínimo de la función de error, entonces en dicho punto el error es próximo a cero, lo cual implica que la salida de la red es próxima a la salida deseada, alcanzándose así, la meta de la regla de aprendizaje”.

El objetivo principal de este aprendizaje es minimizar el error total general de la Red, para que se lleve a cabo esto, se ejecuta una metodología que consiste en una sucesiva minimización de los errores para cada uno de los patrones (�, ��N, ���). En esta metodología los pesos y umbrales se van corrigiendo de

forma iterativa, a medida que la red se adapta al comportamiento deseado para la investigación; todas estas iteraciones se ejecutan hasta que la red realice todo el estudio necesario para la búsqueda del mínimo valor de la función objetivo. Es necesario resaltar que cada presentación del conjunto total de patrones constituye lo que es conocido como época.

Existen diversos algoritmos de aprendizaje para el proceso de la minimización de los errores, dentro de ellos se destaca uno altamente utilizado para tipos de

Page 82: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

aprendizaje supervisado con alimentación hacia adelante conocido como Backpropagation; una de sus principales características es la utilización de la técnica de descenso del gradiente para buscar una solución al problema de minimización, esto no deja de mostrar ciertas desventajas en los que se refiere a velocidad de convergencia, dado que el ajuste de los umbrales y pesos es realizada teniendo como base la magnitud de la derivada parcial de la función de error con respecto a cada uno de los parámetros, lo que da como resultado a que el algoritmo avance de una manera más lenta en regiones donde el gradiente tiende a ser plano, ya que estas correcciones de pesos y umbrales se realizan a través de un solo parámetro que controla la velocidad de avance.

Después de conocer esta desventaja relevante para el proceso de aprendizaje, se plantea la posibilidad de trabajar con el algoritmo de aprendizaje Resilient Backpropagation43, creado por Riedmiller y Braun (1993), el cual se diferencia del algoritmo clásico, porque este usa una técnica nueva que tiene como objetivo eliminar la influencia nociva que genera la magnitud de la derivada parcial sobre la magnitud de la corrección de los pesos y umbrales y tenga una mayor convergencia en el desarrollo del aprendizaje.

3.3.2 ESTIMACIÓN DEL MODELO DE RED NEURONAL AUTORREGRESIVA.

Obtenidas 15 distintas arquitecturas, y computadas 25 estimaciones por cada una de estas, es presentado a continuación los resultados obtenidos con respecto al desempeño en entrenamiento, validación y test de la RNA Autorregresiva con menor valor estadístico MSE de cada arquitectura (Tabla 8, Tabla9 y Tabla 10).

En la tabla 8 se puede observar la evaluación en la parte de entrenamiento, para el análisis del estadístico de pronóstico de error: RMSE, frecuentemente usado para valorar predicciones, la justificación de su uso se basó en lo que indica Corres Guillermo, Esteban Alejandra y Zárate Claudia en su documento de trabajo “Análisis de series temporales”, donde indican que: ”A partir de suponer que los errores muy grandes en el pronóstico tienen un impacto más negativo que el efecto positivo generado por un error pequeño y considerando que por el cálculo que se realiza, el RMSE asigna más ponderación a los errores grandes, es que se lo considera mejor criterio al momento de seleccionar el método más adecuado de 43

Utilizado en algunos trabajos Como: “Resilient Backpropagation algorithm for breast biopsy classification base on artificial neural networks” de A1-Naima and A1-Timemy (2009), y “Resilient Backpropagation neural network for approximation 2-D GDOP” de Chen and Su (2010).

Page 83: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

pronóstico. (Berenson et al. 2001; Fogarty et al. 1999)”; todo esto es utilizado con el propósito de elegir la mejor arquitectura en las RNA propuestas. (Para observar las especificaciones de la formulación de las medidas de evaluación de pronostico dichas anteriormente, ver anexo 2). En la tabla número 9 y la tabla número 10, se puede observar la valoración en la parte de validación y test respectivamente sobre las mismas arquitecturas seleccionadas en el análisis de la parte de entrenamiento (tabla número 8), para el estadístico RMSE.

De este modo, se establece que para elegir la mejor arquitectura de la red neuronal que mejor desempeño presento en el pronóstico, se escoge la más eficiente en la parte de test, pero es necesario analizar las estructuras dentro de muestra (parte de entrenamiento y de validación), y confirmar que ésta arquitectura de test no sea la menos eficiente en términos de RMSE, para el análisis de la parte de entrenamiento, el mejor desempeño es presentado por la combinación P=3 y Q=3, seguido del desempeño de las combinaciones P=1 y Q=5 y P=1 y Q=4; la de menor coeficiente está en la arquitectura P=1 y Q=1, mientras que en el análisis en la parte de validación, el mejor desempeño lo presenta la combinación P=1 y Q=5, seguido del desempeño de las combinaciones P=3 y Q=4 y P=1 y Q=4; el que mostro menor desempeño fue la combinación P=1 y Q=1, por último, en la parte de test, el desempeño más óptimo lo presento la combinación P=2 y Q=5, seguido del desempeño de las combinaciones P=1 y Q=2 y P=3 y Q=2; la de menor eficiencia fue la estructura P=3 y Q=1. Por consiguiente, es seleccionada como la mejor RNA Autorregresiva la red cuya arquitectura es P=2 y Q=5, en la parte de test, ya que el objetivo de esta investigación es evaluar el desempeño en predicción de los modelos, además de que demuestra un desempeño satisfactorio también en la parte de entrenamiento y validación, sin ser el coeficiente más pequeño, pero tampoco el más grande, esta decisión se toma sin quitarle importancia al análisis de la parte de entrenamiento y validación.

Este tipo de metodologías, también utilizadas en el trabajo de Munir A, Jalil B y Martha Misas A. (2006) para el banco de la república, son dadas para identificar las mejores estructuras de la RNA que puedan explicar la variable objetivo, debido a que las RNA no manejan una metodología clara para su proceso como se indicaba en las desventajas de estos modelos, es necesario hacer el proceso de escogencia de varias estructuras para hallar la más óptima, es decir el vector de pesos óptimos o ideales.

Page 84: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Tabla 8. Red Neuronal Autorregresiva: Evaluación en la parte de entrenamiento.

Con amarillo se sombrea el mejor valor del estadístico RMSE, seguido en orden de importancia por el color azul y el color naranja, el color verde hace referencia a la estructura del menor coeficiente RMSE presentado en la parte de test y el color rojo es el que menor desempeño presento en la parte de entrenamiento.

Tabla 9. Red Neuronal Autorregresiva: Evaluación en la parte de validación.

Page 85: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Con amarillo se sombrea el mejor valor del estadístico RMSE, seguido en orden de importancia por el color azul y el color naranja, el color verde hace referencia a la estructura del menor coeficiente RMSE presentado en la parte de test y el color rojo es el que menor desempeño presento en la parte de validación.

Tabla 10. Red Neuronal Autorregresiva: Evaluación en la parte de test.

Con amarillo se sombrea el mejor valor del estadístico RMSE, seguido en orden de importancia por el color azul y el color naranja, por último, el color rojo está representado por el menor RMSE calculado en la parte de test.

3.3.3 EVALUACIÓN DEL MEJOR MODELO ENTRE RNA Y ARIMA -GARCH.

Para este apartado, se toma el modelo de Red Neuronal Autorregresivo, según la estructura que presento mejor desempeño en la parte de test y resaltando que esta arquitectura tanto en el análisis de entrenamiento y validación, no está dentro de los más grandes, pero tampoco está dentro de los más pequeños, posteriormente éste modelo es comparado con el mejor modelo lineal ARIMA-GARCH, calculado previamente; se analizan estos resultados a través del

Page 86: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

estadístico de error en la parte de test: RMSE, para cada uno de los modelos anteriormente dichos:

Tabla 11. Comparación del desempeño en la parte de test de los modelos RNA Autorregresivo y ARIMA-GARCH (Con distribución GED).

Esta comparación nos muestra que las diferencias no son tan significativas, en este caso, para términos de análisis de resultados, entre los modelos lineales ARIMA-GARCH y las RNA, y teniendo como soporte el indicador de desempeño, la RNA presenta el mejor desempeño en términos de pronóstico.

A continuación se presentara el gráfico con el mejor modelo de predicción, donde se verifica el precio real Vs el precio pronosticado por la RNA Autorregresivo en el subconjunto de test, mostrado como evidencia del análisis hecho:

Grafico 19. Precio real acción de Bancolombia Vs pronóstico modelo RNA Autorregresivo con la mejor arquitectura.

Page 87: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

4. EVALUACIÓN FINANCIERA DEL RESULTADO DE PRONÓSTIC O DERIVADO DEL MEJOR MODELO.

En lo que se refiere a la operatividad del modelo, se realiza de igual forma que en la RNA, a través del Software MATLAB, siguiendo la metodología de crear las matrices con los resultados más óptimos de los pesos y umbrales generadas por la mejor estructura, y allí se hace la respectiva valoración del modelo para el ejemplo en las fechas establecidas.

4.1 ESTRATEGIA PROPUESTA.

Con el objetivo de hacer una valoración de la predicción dada por el mejor modelo propuesto, se da la necesidad de plantear una estrategia de negociación, regido por los siguientes supuestos:

� Se cuenta con un exceso de liquidez para invertir de $500.000.000. � Cuando se realiza la compra de acciones, esta estará compuesta por

paquetes de 1000 acciones cada una. � El dinero que no se va a invertir en la acción de Bancolombia, gana

rendimientos con la tasa libre de riesgo. � Se genera un costo del 0,20% por transacción. � El periodo de negociación será desde el 1 de octubre de 2012 hasta el

1 de noviembre de 2012. � El monto total de los $500.000.000 está invertido el 1 de octubre de

2012 en activos que rentan la tasa libre de riesgo. � No se pueden realizar ventas en corto. � Se tomará la posición de un inversionista conservador y a la hora de

tomar las decisiones de inversión, se compraran de 1 a 2 paquetes de acciones como máximo; transacciones que no tengan un alto nivel de riesgo en la inversión durante el mes de estudio.

ESTRATEGIA:

Resaltando el resultado dado por la predicción del modelo y el comportamiento real del precio de la acción de BANCOLOMBIA, se toma una posición de compra

Page 88: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

al inicio del día, si la predicción determina que el precio de cierre de la acción va a ser mayor, teniendo en cuenta que cubra los costos de la transacción, entonces entenderá como una señal de compra. Al contrario si se presenta en el pronóstico un precio de cierre menor, entonces se entenderá como una señal de venta.

4.2 EVALUACIÓN FINANCIERA DE LA ESTRATEGIA PROPUEST A.

Al colocar en práctica la estrategia propuesta, se consiguió a través de una inversión de $500.000.000 el día 1 de octubre de 2012, un valor futuro de $503.250.619,72 el día 1 de noviembre de 2012, por lo cual corresponde a un rendimiento del 10,83% EA.

Sin aplicar la estrategia de negociación propuesta, esto quiere decir, dejando el dinero invertido en un activo que gana la tasa libre de riesgo, se conseguirá un valor futuro de $500.805.620,15, el día 1 de noviembre de 2012, esto equivale a un rendimiento mínimo del 2,59% EA.

Al observar los resultados que produce el pronóstico en la estrategia propuesta, estos se consideran sobresalientes, sin embargo se deben probar otras estrategias relacionadas con la negociación del activo de Bancolombia y seguir ajustando el modelo.

Adicionalmente, se realizó un análisis del número de veces que acertó y desacertó el pronóstico de la RNA Autorregresiva para verificar el desempeño del mejor modelo a fechas más recientes. Esto genero un resultado, donde se puede concluir que del 100 por ciento de los días trabajados, existe un 63,64% de aciertos en la dirección del precio (Subida o Bajada), y el restante, 36,36% de desaciertos en la predicción.

Tabla 12. Cuadro de análisis sobre el número de aciertos y desaciertos en el pronóstico de la evaluación financiera del proyecto.

Page 89: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Grafico 20. Precio real acción de Bancolombia Vs pronóstico modelo RNA Autorregresiva en la evaluación financiera del proyecto.

5. CONCLUSIONES Y RECOMENDACIONES.

De acuerdo a los resultados obtenidos por los cálculos realizados a través de los modelos RNA Autorregresivo y ARIMA-GARCH univariado, el mejor desempeño en pronóstico, fue dado por el modelo no lineal de Red Neuronal Autorregresivo, con un coeficiente RMSE de 445.95, mientras que para el modelo ARIMA-GARCH fue de 450.75, este resultado se obtuvo a través del estudio sobre la predicción de los precios de la acción ordinaria de BANCOLOMBIA, en donde el modelo RNA Autorregresivo presenta un mejor desempeño, medido en términos de error de pronóstico, sobrepasando el modelo lineal ARIMA-GARCH estimado.

Derivado de estos resultados, se resalta el proceso de elección del mejor modelo ARIMA-GARCH, teniendo en cuenta que de acuerdo al coeficiente RMSE, el modelo con el mejor desempeño fue el de distribución de errores GED con un dato

Page 90: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

de 450.7453, seguido por el modelo con distribución de errores t-student de 450.7481 y por último el de distribución de errores normal de 462.2690.

No obstante, los resultados obtenidos por dichas medidas muestran que las diferencias no son tan significativas, por esta razón, para el caso de escoger cual es el mejor modelo, entre la propuesta lineal y la no lineal, apoyado en el indicador de desempeño de pronóstico, el cálculo da como modelo optimo al RNA Autorregresivo.

Según lo planteado anteriormente, estos resultados conforman una evidencia de que existen comportamientos no lineales en las series financieras, dejando claro que se debe realizar otros estudios y otros análisis sobre diferentes acciones derivadas de distintos sectores económicos del país, así como también realizar pruebas sobre los retornos de las mismas.

En lo que se refiere a las variables de pronóstico de PREDBANCOL , se halló que dentro del conjunto de variables que la explican de manera no lineal están: rezagos de la variable objetivo PREDBANCOL(-1) es decir rezagado un periodo y PREDBANCOL(-3) es decir rezagado 3 periodos.

El modelo no lineal de red neuronal autorregresiva, escogido como el de mejor desempeño, se conformó en dos conjuntos en la superficie de entrada, uno conformado por tres variables que ayudan a la explicación de la variable objetivo dependiente de forma lineal, y el otro conformado por dos variables (P=2) que ayudaron a explicar la variable dependiente de forma no lineal; su estructura consta de cinco neuronas (Q=5) en la capa oculta y una neurona en la capa de salida, la función de activación que se usó para la capa oculta es una tangente sigmoidea, mientras que para la capa de salida fue una función lineal; se escogió como regla de propagación la suma de todas las entradas de forma ponderada; y como algoritmo de aprendizaje se eligió el Resilient Backpropagation, como se indicó en apartados anteriores.

Al estructurar una estrategia para la evaluación financiera del modelo con el mejor desempeño, que para este caso es la RNA, en la toma de decisiones de inversión, se confirma que la estrategia genera rendimientos superiores al rendimiento libre de riesgo, con una tasa de rendimiento del 10.83% E.A comparada con una tasa de rendimiento del 2.59% E.A que daba la decisión de invertir a la tasa libre de riesgo; se considera que los resultados son óptimos, sin embargo, el resultado propone el estudio de nuevas estrategias, y seguir perfeccionando el modelo para una mejor predicción y por consiguiente mejores utilidades en la ejecución de la toma de decisiones.

Page 91: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

Adicionalmente se destaca el hecho de que para poder plantear un modelo ARIMA y un modelo GARCH univariado se requiere de un experto que establezca el procedimiento a seguir dependiendo del tipo de datos a estudiar, además de que estos datos tienen que ser estacionarios, se deben verificar los gráficos de correlación, adecuar los modelos y medir los errores, para el caso del modelo dado por redes neuronales artificiales, éste es más sencillo de implementar y además presento mejor desempeño en términos de error de pronóstico.

En el planteamiento de problema de esta investigación se quiere establecer que ventajas a nivel teórico tienen las RNA sobre los modelos ARIMA-GARCH, y después de realizar el modelamiento se tiene que:

• Como ya se indicaba en apartados anteriores, las RNA tiene la capacidad de aprender a realizar trabajos, en base a un entrenamiento y una experiencia inicial, facultad que no posee los modelos ARIMA-GARCH.

• La tolerancia a daños, esto quiere decir que la destrucción parcial de una red, afecta de manera directa su estructura, pero algunas capacidades de la red se pueden retener.

• El proceso de estructuración de la red se hace cuando se diseña, y después de que se crea, es muy fácil cambiar su arquitectura para que aprenda o pronostique con un mejor desempeño, sin necesidad de volver a estructurarla para cualquier tipo de datos, mientras que en los modelos ARIMA-GARCH es necesario verificar la naturaleza de comportamiento de cada tipo de serie y volver a hacer cada una de las pruebas correspondientes, lo cual conlleva un tiempo más prolongado para generar una buena predicción.

A nivel cuantitativo, se resalta la ventaja de eliminar pruebas de hipótesis que justifiquen el uso del modelo, es decir en los modelos ARIMA-GARCH, es necesario cumplir ciertos criterios estadísticos para poder estructurar un modelo de pronóstico especifico, dependiendo de la serie estudiada, en cambio, las RNA manejan un método basado en el aprendizaje de datos, y no necesitan cumplir ningún criterio para poder aprender de la información que se le ingresa y poder construir un modelo de predicción óptimo.

Recomendaciones

Por último, es necesario resaltar que esta investigación se ha hecho bajo un mercado altamente cambiante, por consiguiente se sugiere re-entrenar la red de

Page 92: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

forma periódica para que no pierda su capacidad de adaptación y de predicción para otras épocas de estudio, otros sectores económicos, otros mercados (internacionales) y en general otro tipo de acciones.

REFERENCIAS BIBLIOGRÁFICAS.

Para el desarrollo de este trabajo se tomaron datos e información de las siguientes referencias bibliográficas:

• Juan diego Gómez G. (1999). Acciones, Teoría y práctica del mercado de renta variable. Publicación de la Universidad Pontificia Bolivariana.

• Frank J. Favozzi, Franco Modigliani, Michael G. Ferri. Mercados e instituciones financieras. Pretince – Hall Inc.

• Juan diego Gómez G. Inversiones y Mercado de capitales (caso colombiano). Universidad Pontificia Bolivariana.

• Vicente Tena Rodríguez. Análisis de los mercados de valores, (una

aproximación a su estructura y funcionamiento). DYNKINSON, S.L.

• Roberto pinilla Sepúlveda, Luis Antonio Valero Rueda, Alexander Guzmán Vásquez, Operaciones en el mercado de capitales. Publicación de CORREVAL (Sociedad Comisionista de bolsa).

• Guía del mercado de valores. 5 de febrero de 2010. En www.bvc.com.co. Bolsa de Valores de Colombia.

• Carlos Mate. Modelos ARIMA. Universidad Pontificia ICAI ICADE Comillas Madrid, Escuela Técnica Superior De Ingeniería.

• Álvaro Montenegro García. Series de Tiempo. (2009). (6a Ed). Pontificia Universidad Javeriana, Facultad de ciencias Económicas y Administrativas.

• Damodar Gujarati, Econometría. (4a Ed). Mc Graw Hill.

Page 93: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• José R. Hilera / Víctor J. Martínez. Redes Neuronales Artificiales,

Fundamentos, Modelos Aplicaciones. Alfaoemga.

• Informe de gestión 2011 (Management Report 2011). 02 de febrero de 2012 en www.grupobancolombia.com. Bancolombia.

• Prof Dr. Pablo García Estévez. Documento de trabajo, “Aplicaciones de las Redes Neuronales en las Finanzas”. (2002). Madrid, España. Universidad Complutense de Madrid, Facultad de Ciencias Económicas y Administrativas.

• Joan Bosch, Luis Garrido, Sergio Gómez. Predicción de índices de futuros financieros mediante redes neuronales. (1997). Barcelona, España. Universidad de Barcelona, Facultad de Física.

• Javier Del Carpio Gallegos. Las Redes Neuronales Artificiales en las Finanzas. (2005). Lima, Perú. Universidad Nacional Mayor de San Marcos,

• Juan Miguel Marín Diazaraque. Introducción a las Redes Neuronales Aplicadas. (2010). Madrid, España. Universidad Carlos III de Madrid.

• Alumna: Pamela Jerez López, Profesor Guía: Dr. Antonio Parsi Fernández. Técnicas Avanzadas Aplicadas a La Predicción del índice de Malasia. (2007). Santiago de Chile. Universidad de Chile, Facultad de Ciencias Económicas y Administrativas, Escuela de Administración.

• Fredy Ocaris Pérez Ramírez, Horacio Fernández Castaño. Las redes Neuronales y la Evaluación del riesgo de Crédito. (2007). Medellín, Colombia. Revista Ingenierías, Universidad de Medellín.

• Rafael de Arce Borda. 20 Años de Modelos ARCH: Una Visión de Conjunto de las Distintas Variantes de la Familia. Madrid, España. Universidad Autónoma de Madrid, Departamento de Economía Aplicada.

• Heivar Yesid Rodríguez Pinzón. Profundización teórica de modelos de volatilidad ARCH-GARCH y una aplicación al caso colombiano. (2009). Bogotá, Colombia. Universidad Santo Tomas.

Page 94: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• Pilar Beatriz Álvarez Franco, Diego Alexander Restrepo, Fredy Ocaris Pérez. Estudio de Efectos Asimétricos y Día de la Semana en el Índice de Volatilidad “VIX”. (2007). Medellín, Colombia. Revistas Ingenierías, Universidad de Medellín.

• García Centeno, María del Carmen, Calvo Martin, Meri Emilia. Estimación de Modelos de Volatilidad Estocástica en Series de Rendimientos Bursátiles. Madrid, España. Universidad San Pablo CEU (Madrid); Universidad Complutense de Madrid.

• Carlos Mario García Díaz. (2012). “Predicción del Comportamiento de la Rentabilidad de la Acción de ISAGEN, a Partir de la Técnica de Redes Neuronales Artificiales”. Tesis de grado obtenida no publicada. Pontificia Universidad Javeriana, Facultad de Ciencias Económicas y Administrativas, Maestría en Economía. Bogotá, Colombia.

• “Historia Sistema Financiero Colombiano”. 25 de agosto de 2012 en www.gacetafinanciera.com. Sergio Iván Zapata Sierra.

• Informe de Inclusión Financiera Colombia 2011. 02 de febrero de 2012 en www.asobancaria.com/portal/pls/portal/docs/1/2150122.pdf. Asobancaria.

• Raúl Rojas. Neural Networks a Systematic Introduction. (1996). Berlin, Germany.

• Andrew Skabar & Ian Cloete. Neural Networks, Financial Trading and the Efficient Markets Hypothesis. Brushal, Germany. School of Information Tecnology, International University in Germany.

• Prem Chand Kumar, Ekta Walia. Cash Forecasting: An Application of Artificial Neural Networks in Finance. (2006). Chandigarh, India. Department of Computer Sciense, National Institute of Technical Teachers Training & Research and IT Service Department, State Bank of India.

• Isasi y Galván. Redes Neuronales Artificiales, Un enfoque práctico. (2004). Universidad Carlos III de Madrid.

• Federico Ospina D’Aleman y David Alejandro Giraldo Sánchez. Aplicación de los modelos GARCH a la estimación del VAR de acciones colombianas. (2009). Revista Soluciones de Postgrado EIA.

Page 95: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• Guillermo A. Corres, Alejandra Esteban, Juan Carlos García y Claudia

Zárate. Análisis de series temporales. (2009). Tandil, Argentina, Universidad Nacional del centro y Universidad Nacional de Mar del plata.

• Fernando Villada, Diego Raúl Cadavid y Juan David Molina. Pronóstico del precio de la energía eléctrica usando redes neuronales artificiales. (2008). Medellín, Colombia. Universidad de Antioquia.

• Juan Mascareñas. El mercado internacional de acciones, (2005). Madrid, España, Universidad Complutense de Madrid.

• Bollerslev, tim. “Generalized Autoregressive Conditional Heteroskedasticity”, (1986). Journal of Economics.

• Box, George and Jenkins, Gwilym. “Time Series Analysis: Forecasting and Control, (1970). San Francisco: Hoden-Day.

• Robert F. Engle. “Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of UK Inflation”, (1982). Econometrica 50.

• www.grupobancolombia.com

• www.nyse.com

• www.bvc.com.co

• www.aprenderbolsa.com

• www.anif.org

• www.amvcolombia.org.co

Page 96: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

ANEXOS.

ANEXOS 1: SALIDAS DE PRUEBAS Y RESULTADOS DE LOS MODELOS ARIMA Y GARCH – EVIEWS.

EVIDENCIA 1: PRUEBA ADF PARA LA ESTACIONARIEDAD SIN DIFERENCIACIÓN:

En el proceso del test ADF, se resalta el hecho de la realización de algunas pruebas para poder determinar si es significativo colocar el intercepto y la tendencia, opciones que aparecen en la plataforma de Eviews para calcular la probabilidad del test, de acuerdo a estas verificaciones, se establece que al introducirlos, estos no demuestran significancia en la prueba y por consiguiente se deben quitar.

Page 97: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 2: PRUEBA ADF PARA LA ESTACIONARIEDAD CON UNA DIFERENCIACIÓN:

Page 98: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 3: CORRELOGRAMA DE FAC Y FACP:

En este apartado se tuvo en cuenta tanto los gráficos del FAC como del FACP, para poder determinar el modelo ARIMA que mejor explique la serie objetivo.

Page 99: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 4: ESTIMACIÓN DEL MODELO ARIMA:

Page 100: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 5: INVERSOS DE LAS RAICES DEL POLINOMIO CARACTERÍSTICO DEL MODELO ARMA DENTRO DEL CÍRCULO UNITARIO:

Al verificar la prueba ARMA Struture en EVIEWS (Prueba de raíz unitaria), se confirma que tanto los puntos de los AR, como los de los MA. Quedan dentro del círculo de la raíz unitaria, es decir, no superan a 1 y se determina que cumple con este criterio y se puede modelar.

Page 101: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 6: CORRELOGRAMA DE ANÁLISIS DEL ESTADISTICO Q SOBRE LOS RESIDUOS DEL MODELO ARIMA PLANTEADO:

Page 102: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 7: CORRELOGRAMA DE ANÁLISIS DE LA ESTADISTICA Q SOBRE LOS RESIDUOS DEL MODELO ARIMA AL CUADRADO:

Page 103: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 8: PRUEBA LM PARA DETERMINAR SI EXISTE EFECTO ARCH:

Page 104: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 9: ESTIMACIÓN DEL MODELO ARCH, AJUSTANDO LOS ERRORES CON UNA DISTRIBUCIÓN NORMAL:

Page 105: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 10: ESTIMACIÓN DEL MODELO ARCH, AJUSTANDO LOS ERRORES CON UNA DISTRIBUCIÓN T-STUDENT:

Page 106: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 11: ESTIMACIÓN DEL MODELO ARCH, AJUSTANDO LOS ERRORES CON UNA DISTRIBUCIÓN (GED):

Se debe tener en cuenta que de acuerdo a capítulos anteriores, el modelo ARIMA-GARCH con mejor desempeño de pronóstico es el ARIMA-GARCH con distribución de errores GED. El cual es el que se compara con el mejor modelo de RNA Autorregresiva.

Page 107: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

EVIDENCIA 12: PRUEBA DE NO LINEALIDAD: TEST BDS:

Para este tipo de pruebas, es importante la escogencia de un �, para éste, es frecuente elegir múltiplos de la desviación estándar de la serie analizada, habitualmente, 0.5, 1, 1.5 y 2 veces la misma. Es por esta razón, que para esta

investigación, se ha utilizado el test BDS con diferentes �; haciendo referencia a lo que dice Mantilla, Rodríguez y Sanz (2001), “de acuerdo a como se va

aumentando el �, el test BDS deja de rechazar la hipótesis nula, entonces podría ser una evidencia de la presencia de ruido blanco en la serie original”. Para este

caso en particular, en todos los valores de � probados, siempre se rechazó la hipótesis nula de linealidad, lo que da a entender que existe una certeza de que hay una relación no lineal entre la variable dependiente PREDBANCOL y sus variables independientes.

• Test BDS con un � igual a 0,5 veces la desviación estándar de la seri e de residuos de ajuste del modelo ARIMA-GARCH con di stribución de errores GED.

Page 108: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• Test BDS con un � igual a 1 vez la desviación estándar de la serie de residuos de ajuste del modelo ARIMA-GARCH con distr ibución de errores GED.

• Test BDS con un � igual a 1,5 veces la desviación estándar de la seri e de residuos de ajuste del modelo ARIMA-GARCH con di stribución de errores GED.

Page 109: TRABAJO FINAL DE GRADO - Universidad Piloto de Colombia

• Test BDS con un � igual a 2 veces la desviación estándar de la serie de residuos de ajuste del modelo ARIMA-GARCH con di stribución de errores GED.

ANEXOS 2: FORMULAS PARA MEDIDAS DE EVALUACIÓN DE PRONÓSTICOS (ESTADÍSTICOS DE ERROR).

� Root Mean Squared Error (RMSE):

���! = �2 $���� − ����2�'

� Mean Squared Error (MSE):

��! = 2 $���� − ����2�'