Este apartado divídese en tres subapartados nos que se describe o proceso de obtención dos datos necesarios para realizar o resto do procedemento. O primeiro detalla os pasos realizados para obter os datos das empresas e seleccionar aquelas coas que traballaron no resto do procedemento. O segundo subepígrafe presenta unha breve explicación dos indicadores calculados que se utilizarán como variables de entrada, xunto cos valores históricos de rendibilidade das empresas seleccionadas no primeiro subepígrafe. O terceiro subepígrafe expón o procedemento realizado para a creación dos vectores de entrada e saída a partir dos datos resultantes do segundo subepígrafe.

2.4.1 Recollida de datos

Unha explicación máis detallada sobre o código empregado para realizar o procedemento descrito neste subtítulo pódese atopar en Anexo 4 - Recollida de datos.

Co fin de exemplificar como as redes neuronais artificiais e a programación cuadrática poden utilizarse nunha estratexia de xestión de carteiras, decidiuse neste traballo utilizar datos do mercado español. Por iso, decidiuse traballar coa información correspondente ás empresas que figuran na lista de sociedades cotizadas que se expón en “Empresas Cotizadas” (n.d.) e que se pode ver en Táboa 2.

O Táboa 2 recolle os datos das r nrow(empresas)empresas. Os datos recollidos son o nome, ticker, sector e subsector, mercado, índice de cada unha das empresas e se foron seleccionadas ou non para realizar o resto do trámite unha vez realizados os trámites indicados neste subepígrafe.

Para obter os datos das empresas e analizalos para seleccionar aquelas coas que traballamos no resto do procedemento utilizouse como fonte (n.d.a). A continuación, explícase o proceso realizado para obter e seleccionar os datos.

Decidiuse descargar os datos mensuais de cada unha das empresas recollidos en Táboa 2. Obtención de todos os datos comprendidos entre o 31 de xaneiro de 2000 e o 28 de febreiro de 2023 de cada unha das entidades.

Despois da obtención dos datos, avaliouse a súa calidade. A avaliación comezou cunha análise exploratoria visual dos prezos axustados xa que, como se explicou no capítulo anterior, estes son os idóneos para utilizar en calquera metodoloxía de análise histórica.

Durante a citada análise visual exploratoria detectouse que había irregularidades nos prezos axustados dalgunhas das series. As irregularidades detectadas consistiron no rexistro incorrecto dos prezos axustados, así como erros no seu cálculo. Estes erros detectáronse facilmente observando os gráficos de valores de prezos de peche axustados de tendencia constante durante longos períodos de tempo, como se ve en Figura 6, o que indica un rexistro incorrecto dos cambios de prezos; así como cambios bruscos de ata máis do 100% nos mesmos nun único período de tempo, que poden indicar un erro de cálculo no prezo axustado, como se observa en Figura 7, neste último caso comprobouse con outras fontes como (n.d.b), para verificar que os prezos se calcularon mal.

Dado o tempo dispoñible para realizar o estudo descrito no procedemento e o amplo tempo que requiriría realizar a investigación para substituír os valores erróneos da serie, optouse por eliminar estas irregularidades utilizando só os valores posteriores a xaneiro de 2005, que xa non presentaban inconsistencias no cálculo do prezo axustado, posteriormente elimináronse aquelas series que aínda contiñan valores ausentes e que presentaban irregularidades no rexistro das variacións, para estes últimos, aquelas series en que as variacións dos prezos non rexistrados están en máis de 10 observacións.

Quedando despois dos axustes realizados ás r length(returns_emps3)empresas, tal e como se ve na columna seleccionada do Táboa 2, algunhas destas empresas teñen un número diferente de observacións, porque non todas existían nin saíran ao mercado. mercado antes de xaneiro de 2005.

Unha vez seleccionadas as empresas coas que traballamos, calculáronse os seus rendementos a partir dos prezos axustados. Ademais das rendibilidades correspondentes ás empresas seleccionadas, utilizáronse as rendibilidades do prezo de peche axustado do IBEX 35, así como outras variables que serven de indicadores do comportamento das rendibilidades, e da súa relación coas do índice. neste caso as do IBEX 35. Estas variables inclúen as volatilidades das empresas e do índice, a correlación entre os valores da serie e o IBEX, e a beta das empresas en relación co IBEX.

2.4.2 Indicadores

Este subepígrafe presenta unha breve explicación das variables calculadas a utilizar como variables de entrada en conxunto cos valores históricos dos rendementos das empresas. Unha explicación máis detallada sobre o código empregado para realizar o procedemento descrito neste subtítulo pódese atopar en Anexo 4 - Indicadores.

2.4.2.1 Volatilidade

Partindo de Hargrave (2023) e Hayes (2023), a desviación estándar e a volatilidade son dous conceptos relacionados que miden o que flutúa o prezo dunha acción ou doutro activo ao longo do tempo. A desviación estándar é un termo estatístico que cuantifica a dispersión dun conxunto de puntos de datos arredor do seu valor medio. A volatilidade é un termo financeiro que describe o grao de variación dos rendementos dun activo durante un período de tempo determinado.

A desviación estándar e a volatilidade son importantes na análise do mercado de accións porque indican o risco e a incerteza asociada ao investimento nun activo determinado. Unha alta desviación estándar ou volatilidade significa que o prezo do activo pode cambiar significativamente en calquera dirección, o que implica un maior potencial de ganancias ou perdas. Unha baixa desviación estándar ou volatilidade significa que o prezo do activo é relativamente estable e previsible, o que significa menos potencial de ganancias ou perdas Hayes (2023).

Para calcular a volatilidade dunha acción ou índice, calcúlase a desviación estándar dos rendementos. Polo tanto, os cálculos necesarios son os que se indican a continuación no Ecuación 1.

\[R_i = \frac{P_i - P_{i-1}}{P_{i-1}}\]

\[\sigma = \sqrt{\frac{\sum_{i=1}^N (R_i - \bar{R})^2}{N} } \tag{1}\]

onde:

  • \(R_i\) é o retorno das accións no período \(i\)

  • \(P_i\) y \(P_{i-1}\) son os prezos dunha acción nos períodos de tempo \(i\) e \(i-1\), respectivamente.

  • \(\sigma\) esa desviación estándar - \(N\) é o número de observacións

  • \(\bar{R}\) é o rendemento medio das accións.

A desviación estándar e a volatilidade son ferramentas útiles para que investidores e analistas avalien o equilibrio risco-recompensa de diferentes activos e carteiras. Tamén poden axudar a comparar o rendemento de diferentes activos e carteiras ao longo do tempo e en diferentes condicións de mercado.

2.4.2.2 Correlación

Como explica Edwards (2022), a correlación é unha medida estatística que determina como se moven dúas variables entre si. Na análise do mercado de valores, a correlación pode axudar a comprender o comportamento das diferentes accións ou indicadores do mercado ao longo do tempo. Tomando como exemplo os datos empregados neste traballo, se os prezos dunha das empresas seleccionadas tenden a subir e baixar xunto co IBEX 35, estes prezos teñen unha correlación positiva. Se, pola contra, os prezos da empresa tenden a subir ao caer o indicador IBEX 35, teñen unha correlación negativa. Un coeficiente de correlación cero significa que non existe unha relación lineal entre as variables, sendo neste caso os valores do IBEX 35 e os prezos dunha das empresas determinadas.

Como expuxo Ross (2022), a correlación entre dúas variables calcúlase mediante a seguinte ecuación: Ecuación 2:

\[\rho_{xy} = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n (x_i - \bar{x})^2}\sqrt{\sum_{i=1}^n (y_i - \bar{y})^2}} \tag{2}\]

onde:

  • \(\rho_{xy}\) é o coeficiente de correlación

  • \(n\) é o número de observacións

  • \(x_i\) y \(y_i\) son os valores das dúas variables para a observación \(i\)

  • \(\bar{x}\) y \(\bar{y}\) son as medias das dúas variables.

Como tamén explica Edwards (2022), o coeficiente de correlación varía de -1 a 1, onde -1 indica correlación negativa perfecta, 1 indica correlación positiva perfecta e 0 indica ningunha correlación. Podendo comprender que canto máis próximo estea o coeficiente de correlación tanto a -1 como a 1, máis forte é a relación lineal entre as variables analizadas.

Como se explicou anteriormente, o coeficiente de correlación, neste traballo, pode utilizarse para analizar como se moven os rendementos dunha empresa en comparación cos do IBEX35. A correlación tamén se pode utilizar para diversificar unha carteira escollendo accións que teñan unha correlación baixa ou negativa entre si, como explica Boyte-White (2022). Isto pode axudar a reducir o risco global da carteira, xa que as perdas dunha acción poden compensarse coas ganancias doutra. Non obstante, a correlación non é constante e pode cambiar co tempo debido a diversos factores, como as condicións do mercado, os acontecementos económicos ou as noticias da empresa. Polo tanto, é importante supervisar a correlación de accións regularmente e axustar a carteira en consecuencia Boyte-White (2022).

A correlación é unha ferramenta valiosa na análise do mercado de valores, pero non implica causalidade. Ter unha correlación alta ou baixa entre dúas variables non implica que unha variable provoque cambios na outra. A correlación mide simplemente a forza e a dirección da relación lineal entre dúas variables, sen ter en conta outros factores que poidan influír nelas.

Como tamén se expuxo en Edwards (2022), a correlación está moi relacionada coa volatilidade do mercado e das accións, podendo constatar que, en períodos de maior volatilidade, como a crise financeira de 2008, as accións poden ter unha tendencia a estar máis correlacionados, aínda que sexan de sectores diferentes. Os mercados internacionais tamén poden estar moi correlacionados en tempos de inestabilidade. Os investimentos poden querer incluír activos nas súas carteiras que teñan unha baixa correlación de mercado cos mercados de accións para axudar a xestionar o seu risco.

2.4.2.3 Beta

Segundo explica Kenton (2022), a beta é unha medida da sensibilidade dos rendementos dunha acción aos cambios nos rendementos do mercado. Calcúlase como a pendente da recta de regresión que se axusta aos rendementos históricos das accións e do mercado. Unha beta de 1 significa que as accións se moven sincronizadas co mercado, unha beta superior a 1 significa que as accións son máis volátiles que o mercado e unha beta inferior a 1 significa que as accións son menos volátiles que o mercado.

A beta é importante na análise do mercado de accións porque, como explica Kenton (2022), axuda aos investimentos a avaliar o risco e o rendemento dunha carteira. Ao coñecer a beta de cada acción dunha carteira, os investimentos poden estimar canto flutuará a carteira cos movementos do mercado e axustar a súa distribución de activos en consecuencia. Por exemplo, se un investidor quere reducir o risco na súa carteira, pode escoller accións con valores beta baixos ou negativos que tenden a moverse na dirección oposta do mercado.

Segundo explica Monaghan (2019), a beta está relacionada coa cartografía, pero non son o mesmo. Como se explicou anteriormente, a correlación é unha medida de como están linealmente relacionadas dúas variables, Beta, por outra banda, é unha medida do forte que están relacionadas dúas variables, que indica canto cambia unha variable cando outra variable cambia nunha unidade. A beta pódese calcular a partir da correlación mediante a seguinte ecuación, Ecuación 3:

\[\beta = \frac{\rho_{xy} \sigma_x}{\sigma_y} \tag{3}\]

onde:

  • \(\rho_{xy}\) é o coeficiente de correlación entre \(x\) y \(y\)

  • \(\sigma_x\) é a volatilidade de x

  • \(\sigma_y\) é a volatilidade de y

2.4.3 Vectores

Neste subapartado explícase o procedemento realizado para crear os vectores de entrada e saída a partir dos datos resultantes do procedemento descrito no subapartado anterior. Unha explicación máis detallada sobre o código empregado para realizar o procedemento descrito neste subtítulo pódese atopar en Anexo 4 - Vectores.

A estrutura do conxunto de vectores de entrada e saída é de vital importancia no modelado de técnicas de ML, tendo un impacto significativo na súa eficacia. O conxunto de vectores debe crearse dun xeito representativo do problema que se vai resolver, polo que os pasos que se describen a continuación explican detalladamente os aspectos do problema que se vai responder neste traballo e como darlle forma ao conxunto de vectores de entrada e saída.

Como se mencionou anteriormente, o obxectivo deste traballo é presentar un procedemento para o uso de modelos de ANN e programación cuadrática nunha estratexia de investimento. A modelización aborda a necesidade de obter as predicións o máis precisas posibles para posteriormente, a partir das predicións e dos datos históricos, atopar a composición ideal da carteira. Polo tanto, o problema a representar cos conxuntos de vectores de entrada e saída é como explicar o comportamento da rendibilidade dunha empresa nun instante de tempo \(i+1\) cos valores de varias variables no instante de tempo. \(i\).

Para representar este problema creáronse vectores tridimensionais, seguindo o exposto en Chollet and Allaire (2018). As dimensións destes vectores explícanse do seguinte xeito:

  • A primeira dimensión está composta polo número de mostras obtidas ao seccionar as observacións das diferentes series en vectores bidimensionais consecutivos.

  • A segunda dimensión está composta polo número de observacións, das distintas series, recollidas en cada vector bidimensional.

  • A terceira dimensión é o número de series en cada vector bidimensional.

Polo tanto, para obter correctamente estas mostras, é necesario definir primeiro que serie se utilizará para os vectores de entrada e saída. No apartado anterior definíronse as series utilizadas nos vectores de entrada, sendo as seguintes: os rendementos históricos da empresa e o IBEX, as volatilidades históricas da empresa e o IBEX, a correlación histórica da empresa e o IBEX e o histórico. beta da empresa e do IBEX. A serie utilizada para os vectores de saída é a rendibilidade histórica da empresa.

Posteriormente definiuse o horizonte temporal a prever, aspecto fundamental na creación dos conxuntos de entradas e saídas. O número de observacións definido como horizonte temporal determina as observacións dos vectores de saída, no presente traballo determinouse unha observación como horizonte temporal posto que se desexa prever a rendibilidade do próximo mes das distintas empresas seleccionadas.

E o último aspecto a definir é cantas observacións debe observar o modelo para inferir a saída desexada. Isto define o número de observacións que se tomarán de cada serie temporal para formar os vectores de entrada. Para determinar este aspecto débese levar a cabo un proceso iterativo, probando diferentes cantidades e valorando os resultados obtidos polos modelos que se adestran con elas. Para simplificar o proceso, no presente traballo determinouse probar diferentes tamaños de entrada, sendo estes 1, 2 e 3 observacións. Así, probando de certo xeito como o tamaño das entradas afecta á predición obtida.

Se temos unha matriz para os vectores de entrada que contén unhas r dim(returns_indc[[1]])[1] observacións, podemos calcular o número de mostras obtidas desta matriz seguindo a seguinte ecuación Ecuación 4:

\[ m = n - (i-1+o) \tag{4}\]

onde:

  • \(m\) o número de mostras

  • \(n\) o número de observacións da serie

  • \(i\) y \(o\) o número de observacións nos vecotres de entrada e saída respectivamente.

Na Táboa 3 mostra o número de mostras obtidas para os diferentes tamaños de vectores de entrada propostos, para os que se tiveron en conta os diferentes números de observacións coas que contan as r length(returns_indc) seleccionadas. Na Figura 16 mostra como son os vectores de entrada e saída, no caso de que o vector de entrada teña 3 observacións.