2.3 Composición de carteiras – Traballo Fin de Máster

Neste apartado exponse o problema de atopar a mellor composición de carteira posible e explícase de forma xeral a teoría que se sustenta nos obxectivos para resolvelo. Ademais, enumeraranse as técnicas máis utilizadas, diferenciando enfoques clásicos e enfoques intelixentes. Posteriormente, explicarase o que é a programación cuadrática e mencionaranse algunhas técnicas dentro desta disciplina de optimización matemática. Mostrarase como se pode describir o problema de optimización da carteira como un problema de programación cuadrática. Ademais, farase unha breve explicación do Dual Active Set Method, técnica moi utilizada nesta disciplina e que se utilizará nos seguintes capítulos.

2.3.1 Problema e técnicas

Como explica Gunjan (2023), a optimización da carteira é o proceso de selección da mellor combinación de activos para manter nunha carteira en función de obxectivos predefinidos. Os obxectivos poden ser a maximización do retorno ou a minimización do risco, ou ambos. A optimización da carteira implica atopar os pesos óptimos para cada activo da carteira para que a carteira global cumpra os obxectivos desexados. Este pode ser un problema desafiante debido á gran cantidade de activos para escoller e ás complexas relacións entre eles.

A optimización da carteira é un proceso importante para os investimentos, xa que lles axuda a minimizar o risco e maximizar o retorno dos seus investimentos. Ao seleccionar coidadosamente os activos para manter na súa carteira, os investimentos poden acadar o nivel de risco e rendemento desexados ao tempo que diversifican os seus investimentos para reducir o risco global. A optimización da carteira é un mecanismo crucial utilizado para reducir o risco de investimento.

Existen varias técnicas que se poden utilizar para resolver o problema de optimización da carteira. En Gunjan (2023) estas técnicas clasifícanse en dúas categorías: enfoques clásicos e enfoques intelixentes. A continuación móstrase unha explicación xeral dalgunhas das técnicas pertencentes a cada enfoque.

Enfoques clásicos:

Media-varianza: esta técnica, proposta en Markowitz and Markowitz (1967), baséase na idea de minimizar a varianza para un rendemento esperado determinado ou maximizar o retorno esperado para unha varianza determinada. É unha técnica de programación cuadrática paramétrica (en diante PQP) que se pode utilizar para resolver problemas de optimización cuadrática que xorden na optimización de carteiras (Aijun Zhang & Chun-hung Li & Agus Sudjianto (2008)). O enfoque da varianza media asume que os investidores teñen aversión ao risco e prefiren carteiras con menor varianza. A técnica consiste en construír unha fronteira de carteira que represente o conxunto de carteiras que ofrecen o maior rendemento esperado para un determinado nivel de risco. A continuación, selecciónase a carteira óptima desta fronteira en función das preferencias de risco do investidor.
Varianza sesgada: esta técnica amplía o enfoque da varianza media ao contabilizar a distribución sesgada. Propúxose en Samuelson (1970) e pódese usar cando a función de distribución non é de natureza cuadrática. A asimetría mide a asimetría dunha distribución e pode proporcionar información adicional sobre os riscos potenciais e os rendementos dunha carteira. Ao incorporar a asimetría ao proceso de optimización da carteira, os investidores poden comprender mellor os posibles riscos negativos e tomar decisións máis informadas.
Valor en risco (VaR): este enfoque estatístico mide a potencial perda de valor dunha carteira durante un período definido para un determinado intervalo de confianza. Introduciuse na primeira edición de Jorion (2007) en 1997 e require a determinación de tres parámetros: período de tempo, nivel de confianza e unidade de valor en risco. O VaR proporciona unha medida da perda potencial máxima que podería ocorrer cunha probabilidade determinada nun horizonte temporal especificado. É habitualmente utilizado polas entidades financeiras para xestionar a súa exposición ao risco e cumprir cos requisitos regulamentarios.
Valor en risco condicional (CVaR): este enfoque amplía o VaR tendo en conta a perda esperada que supera o VaR. Introduciuse en Rockafellar and Uryasev (2002) e pode xestionar perdas extremas mediante o uso de pesos dinámicos derivados de datos históricos. O CVaR proporciona unha medida da perda esperada que podería ocorrer máis aló do limiar de VaR. Tamén se coñece como Expected Shortfall (ES) ou Tail Value-at-Risk (TVaR) e considérase unha medida de risco máis consistente que o VaR.
Desviación media absoluta (MAD): esta técnica pódese usar para problemas de selección de carteiras a gran escala e moi diversificados. Introduciuse en Konno and Yamazaki (1991) e penaliza as desviacións tanto positivas como negativas. MAD proporciona unha medida da desviación absoluta media dos rendementos da carteira do seu valor medio. Considérase máis robusta que as medidas baseadas na varianza, xa que é menos sensible aos valores atípicos.
Minimax: esta técnica utiliza o rendemento mínimo como medida de risco. Introduciuse en Cai et al. (2004) e ten certas vantaxes cando os rendementos non se distribúen normalmente. Minimax ofrece unha medida no peor dos casos para unha carteira minimizando a máxima perda potencial que podería ocorrer. Pode ser útil para os investimentos que están especialmente preocupados polos riscos á baixa.

Enfoques intelixentes:

Redes bayesianas: estes modelos gráficos probabilísticos pódense usar para modelar o risco e o rendemento. Presentáronse en Shenoy and Shenoy (2000) e pódense usar para visualizar a relación entre diferentes variables nun modelo. As redes bayesianas proporcionan unha forma de representar dependencias complexas entre variables mediante gráficos acíclicos dirixidos (DAG). Pódense usar para modelar relacións incertas entre variables e para facer predicións probabilísticas sobre eventos futuros. No contexto da xestión de carteiras, as redes bayesianas poden usarse para modelar as relacións entre diferentes activos e facer predicións sobre os seus retornos futuros en base a datos históricos e outra información relevante.
Regresión vectorial de soporte (SVR): esta técnica de aprendizaxe automática pódese usar para determinar a cantidade a mercar e vender. Foi introducido por Drucker et al. (1996) e ten certas vantaxes sobre as técnicas baseadas en estatísticas, como a súa capacidade para aprender a partir de datos históricos. SVR implica construír un hiperplano que separa os puntos de datos con diferentes etiquetas ao tempo que maximiza a marxe entre eles. Pódese usar para tarefas de regresión onde o obxectivo é predicir valores continuos en lugar de etiquetas discretas. No contexto da xestión de carteiras, o SVR pódese usar para predecir os prezos futuros dos activos baseándose en datos históricos e outra información relevante.
Redes neuronais artificiais: como se explicou anteriormente, estes modelos computacionais pódense utilizar para resolver problemas complexos de cómputo e aprendizaxe. No contexto da xestión de carteiras, as redes neuronais pódense usar para predecir os prezos futuros dos activos ou os rendementos en función de datos históricos e outra información relevante, que é para o que se utilizan neste documento.
Aprendizaxe por reforzo: este tipo de aprendizaxe automática implica que un axente ou modelo interactúa co seu entorno para aprender das súas accións. Presentouse en Sutton and Barto (2018) e traballa para maximizar a recompensa dos axentes. A aprendizaxe por reforzo implica a aprendizaxe mediante interaccións de proba e erro cun ambiente. O axente realiza accións en función do seu estado actual e recibe recompensas ou penalizacións en función dos resultados desas accións. Co tempo, o axente aprende a tomar accións que maximizan a súa recompensa acumulada. No contexto da xestión de carteiras, a aprendizaxe de reforzo pódese utilizar para desenvolver estratexias comerciais que maximicen os rendementos ao mesmo tempo que xestionan o risco.

2.3.1 Programación cuadrática

Este subepígrafe explica o que é a programación cuadrática. Cales son algunhas das técnicas que existen dentro desta disciplina de optimización matemática. Tamén se expón como se pode describir o problema de optimización da carteira como un problema de programación cuadrática e explícase brevemente como funciona unha das técnicas máis empregadas nesta disciplina, concretamente o denominado Dual Active Set Method, que se emprega nos capítulos posteriores.

A programación cuadrática pódese escoller entre as técnicas enumeradas no subtítulo anterior por varias razóns. En primeiro lugar, é unha técnica ben establecida que foi amplamente utilizada na optimización da carteira. Pode xestionar problemas de optimización complexos con múltiples restricións e pode proporcionar unha forma eficiente e eficaz de resolver o problema de optimización da carteira. Isto convérteo nunha ferramenta útil para os investimentos que buscan minimizar o risco ao acadar o nivel de retorno desexado. Finalmente, a programación cuadrática ten unha sólida base teórica e foi amplamente estudada na literatura. Isto fai que sexa unha técnica fiable e ben entendida que se pode usar con confianza na optimización da carteira.

Existen varias técnicas de programación cuadrática, entre as máis utilizadas están:

Interior Point: Este é un método de programación lineal ou non lineal que consegue a optimización pasando polo centro do sólido definido polo problema en lugar de arredor da súa superficie. Karmarkar (1984) atopou un algoritmo de programación lineal de tempo polinómico usando un método de punto interior.
Active Set: este é un algoritmo usado para identificar as restricións activas nun conxunto de restricións de desigualdade. As restricións activas exprésanse entón como restricións de igualdade, transformando así un problema restrinxido de desigualdade nun subproblema máis simple de restricións de igualdade. O método de conxunto activo foi introducido por primeira vez nun artigo de Beale (1959) e desenvolvido por Fletcher (1971) e Bunch and Kaufman (1977).
Dual Active Set: o método, tal e como se expón Goldfarb and Idnani (1982) e Goldfarb and Idnani (1983), é un algoritmo dual eficiente e numéricamente estable para a programación cuadrática definida positiva que aproveita o feito de que o mínimo non restrinxido da función obxectivo pode ser usado como un punto de saída.
Augmented Lagrangian: introduciuse de forma independente en Magnus R. Hestenes (1969) e Powell (1969). Utilízase para resolver problemas de optimización restrinxida engadindo un termo de penalización á función obxectivo que penaliza calquera violación das restricións. O termo de penalización adoita ser un múltiplo dunha medida de infracción de restricións, como a suma de infraccións de restricións ao cadrado.
Conxugate Gradient: este é un método iterativo para resolver sistemas de ecuacións lineais cunha matriz definida positiva simétrica. Tamén se pode usar para resolver problemas de optimización sen restricións atopando o mínimo dunha función cuadrática. O método xera unha secuencia de enderezos de busca que se conxugan con respecto á matriz que define o sistema de ecuacións ou función cuadrática. O método de gradiente conxugado foi introducido orixinalmente nun artigo de Magnus R. Hestenes and Stiefel (1952).
Gradient Projection: o método de proxección de gradientes introduciuse en J. B. Rosen (1960) e J. Rosen (1961). Este é un método iterativo para resolver problemas de optimización restrinxida proxectando o gradiente na rexión factible en cada iteración. O gradiente proxectado utilízase entón como dirección de busca e realízase unha busca de liña ao longo desta dirección para atopar unha nova iteración que satisfaga as restricións e reduza a función obxectivo.

Entre as técnicas mencionadas anteriormente, seleccionouse o algoritmo Dual Active Set Method (en diante, DASM) que, como se mencionou anteriormente, foi introducido en Goldfarb and Idnani (1982) e Goldfarb and Idnani (1983), é un algoritmo de optimización para resolver problemas de programación cuadrática. O algoritmo predí o conxunto activo de restricións que se satisfán igualmente na solución do problema. Calcula unha secuencia de solucións óptimas de problemas QP que implican algunhas das restricións do problema orixinal, chamada secuencia de puntos factibles duais.

A continuación móstrase un exemplo xeral de como o algoritmo DASM podería funcionar usando os valores que ocorren para un problema de optimización de carteira de 2 activos, o exemplo foi construído a partir de Goswami, Mondal, and Paruya (2012) e Walker (2014):

Baixo o suposto de que se trata de atopar a mellor composición dunha carteira na que, por simplicidade, teñamos 2 activos, o problema cuadrático exporíase do seguinte xeito Ecuación 1:

\[ \begin{aligned} min~~Q(\vec{w}) &= \vec{w}^TC\vec{w}\\ sujeto~a:\\ w_{1}+w_{2}=1\\ 0\leq{w_{i}}\leq{1}\\ w_{1}\mathbb{E} + w_{2}\mathbb{E} \geq{0.005} \end{aligned} \tag{1}\]

Asumindo que teñen rendementos mensuais medios \(r=\begin{bmatrix} 0,02 & 0,03 \end{bmatrix}\) e unha matriz de covarianza \(C=\begin{bmatrix} 0,001 & 0,0008 \\ 0,0008 & 0,002 \end{bmatrix}\) Os vectores e matrices necesarios para o algoritmo DASM pódense construír do seguinte xeito:

O vector de retorno mensual medio sería \(r=\begin{bmatrix} 0.02 & 0.03 \end{bmatrix}\).
A matriz de covarianza C utilizaríase como matriz D en DASM.
A restrición \(w_{1}+w_{2}=1\) pódese escribir en forma de matriz como \(\begin{bmatrix} 1 & 1 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix}= 1\) . Esta sería a primeira fila da matriz \(A\) en DASM.
O requisito mínimo de retorno \(w_{1}\mathbb{E} + w_{2}\mathbb{E} \geq{0,005}\) pódese escribir en forma de matriz como \(\begin{bmatrix} 0,02 & 0,03 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \geq{0,005}\). Esta sería outra fila da matriz \(A\) en DASM.
As restricións \(0\leq{w_i}\leq{1}\) pódense escribir en forma de matriz como \(\begin{bmatrix} 1 & 0 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \geq{0}\) e \(\begin{bmatrix} 0 & 1 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \geq{0}\) para os límites inferiores e \(\begin{bmatrix} -1 & 0 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \geq{-1}\) e \(\begin{bmatrix} 0 & -1 \end{bmatrix} \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \geq{-1}\) para os límites superiores.
A matriz \(A\) sería así: \(A=\begin{bmatrix} 1 & 1 \\ 0.02 & 0.03 \\ 1 & 0 \\ 0 & 1 \\ -1 & 0 \\ 0 & -1 \end{bmatrix}\)

O vector correspondente \(b\) sería \(\begin{bmatrix} 1 & 0,005 & 0 & 0 & -1 & -1\end{bmatrix}\). Despois podemos usar o algoritmo DASM para resolver este problema de programación cuadrática e determinar a asignación óptima de activos na nosa carteié.

Paso 0: atopé o mínimo sen restricións resolvendo o problema de programación cuadrática sen restricións. Establecer o número de elementos do conxunto activo A (conxunto baleiro) en cero.

Paso 1: Escolla unha restrición violada, se a houbera. Neste caso, supoñamos que se infrinxe a restrición \(w_{1}+w_{2}=1\).

Paso 2: Calcule as direccións do paso primario e dobre e a lonxitude do paso \(t=min(t_{1},t_{2})\). Supoña \(t=t_{2}\).

Paso 3: Da un paso e actualiza o conxunto activo A e a solución (\(S\)) para o par (x, A). Dado que \(t=t_{2}\) , engadimos a p-esima restrición (neste caso \(w_1+w_2=1\)) a \(\bar{N}\) e actualizamos \(H\) e \(N^{*}\) en Ecuación 2.

\[ \begin{aligned} N^{*}=(\bar{N}^{T}Q^{-1}\bar{N})\bar{N}^{T}Q^{-1}\\ H=Q^{-1}(I-\bar{N}N^{*}) \end{aligned} \tag{2}\]

Onde:

\(N^{*}\) é a inversa pseudo-inversa ou xeralizada de Moore-Penrose \(\bar{N}\).

\(\bar{N}\) é a matriz dos vectores normais das restricións no conxunto activo \(A\).

\(H\) é o operador Hessiana inverso reducido de \(Q\).

Estes pasos repítense de forma iterativa ata que se cumpran todas as restricións e se determine a asignación óptima de activos.

Aijun Zhang & Chun-hung Li & Agus Sudjianto, Zhi-li Wu &. 2008. “Trace Solution Paths for SVMs via Parametric Quadratic Programming.” Researchgate. 2008. https://www.researchgate.net/publication/228577955_Trace_solution_paths_for_SVMs_via_parametric_quadratic_programming.

Beale, EML. 1959. “On Quadratic Proramming.” Naval Research Logistics Quarterly 6 (3): 227–43.

Bunch, James R, and Linda Kaufman. 1977. “Some Stable Methods for Calculating Inertia and Solving Symmetric Linear Systems.” Mathematics of Computation 31 (137): 163–79.

Cai, Xiaoqiang, Kok Lay Teo, XQ Yang, and Xun Yu Zhou. 2004. “Minimax Portfolio Optimization: Empirical Numerical Study.” Journal of the Operational Research Society 55 (1): 65–72.

Drucker, Harris, Christopher Burges, Linda Kaufman, Alex Smola, and Vladimir Vapnik. 1996. “Linear Support Vector Regression Machines.” Advances in Neural Information Processing Systems 9 (9): 155–61.

Fletcher, Roger. 1971. “A General Quadratic Programming Algorithm.” IMA Journal of Applied Mathematics 7 (1): 76–91.

Goldfarb, Donald, and Ashok U. Idnani. 1982. “Dual and Primal-Dual Methods for Solving Strictly Convex Quadratic Programs.” In Numerical Analysis, edited by J. P. Hennart, 226–39. Berlin, Heidelberg: Springer Berlin Heidelberg.

———. 1983. “A Numerically Stable Dual Method for Solving Strictly Convex Quadratic Programs.” Mathematical Programming 27: 1–33.

Goswami, Nababithi, Supriyo K. Mondal, and Swapan Paruya. 2012. “A Comparative Study of Dual Active-Set and Primal-Dual Interior-Point Method.” IFAC Proceedings Volumes 45 (15): 620–25. https://doi.org/https://doi.org/10.3182/20120710-4-SG-2026.00029.

Gunjan, Siddhartha, Abhishek & Bhattacharyya. 2023. “A brief review of portfolio optimization techniques.” Artificial Intelligence Review 56 (5): 3847–86. https://doi.org/10.1007/s10462-022-10273-7.

Hestenes, Magnus R. 1969. “Multiplier and Gradient Methods.” Journal of Optimization Theory and Applications 4 (5): 303–20.

Hestenes, Magnus R., and Eduard Stiefel. 1952. “Methods of Conjugate Gradients for Solving Linear Systems.” Journal of Research of the National Bureau of Standards 49: 409–35.

Jorion, Philippe. 2007. Value at Risk: The New Benchmark for Managing Financial Risk. The McGraw-Hill Companies, Inc.

Karmarkar, Narendra. 1984. “A New Polynomial-Time Algorithm for Linear Programming.” In Proceedings of the Sixteenth Annual ACM Symposium on Theory of Computing, 302–11.

Konno, Hiroshi, and Hiroaki Yamazaki. 1991. “Mean-Absolute Deviation Portfolio Optimization Model and Its Applications to Tokyo Stock Market.” Management Science 37 (5): 519–31.

Markowitz, Harry M, and Harry M Markowitz. 1967. Portfolio Selection: Efficient Diversification of Investments. J. Wiley.

Powell, Michael JD. 1969. “A Method for Nonlinear Constraints in Minimization Problems.” Optimization, 283–98.

Rockafellar, R Tyrrell, and Stanislav Uryasev. 2002. “Conditional Value-at-Risk for General Loss Distributions.” Journal of Banking & Finance 26 (7): 1443–71.

Rosen, JB. 1961. “The Gradient Projection Method for Nonlinear Programming. Part II. Nonlinear Constraints.” Journal of the Society for Industrial and Applied Mathematics 9 (4): 514–32.

Rosen, Jo Bo. 1960. “The Gradient Projection Method for Nonlinear Programming. Part i. Linear Constraints.” Journal of the Society for Industrial and Applied Mathematics 8 (1): 181–217.

Samuelson, Paul A. 1970. “The Fundamental Approximation Theorem of Portfolio Analysis in Terms of Means, Variances and Higher Moments.” The Review of Economic Studies 37 (4): 537–42.

Shenoy, Catherine, and Prakash P Shenoy. 2000. “Bayesian Network Models of Portfolio Risk and Return.” In. The MIT Press.

Sutton, Richard S, and Andrew G Barto. 2018. Reinforcement Learning: An Introduction. MIT press.

Walker, Ryan. 2014. “Solving Quadratic Progams with r’s Quadprog Package.” rwalk. 2014. https://rwalk.xyz/solving-quadratic-progams-with-rs-quadprog-package/.