Riesgo de Crédito, modelos de Inteligencia Artificial IA

El riesgo de crédito puede entenderse como un parámetro que mide y predice la probabilidad de impago que tiene una persona, empresa u organización al solicitar un crédito o préstamo y se obtiene a través del análisis de los datos asociados a estas. Al hablar de riesgo de crédito se debe puntualizar la condición que tiene como probabilidad y no una certeza, pues, aunque el análisis de datos permita obtener una estimación precisa del riesgo de no cumplimiento de las obligaciones de pago, siempre existe la posibilidad de que se presenten situaciones financieras imprevistas que influyan negativamente en la capacidad del pago del prestatario.

Como señalamos en una entrada anterior, “Machine Learning en el sector bancario: Una introducción a sus aplicaciones”, el empleo de herramientas tecnológicas basadas en el aprendizaje automatizado tiene una gran diseminación tanto a nivel académico como industrial.

El sector financiero en particular es un gran beneficiario del uso de estas tecnologías al emplear algoritmos que permiten el análisis de patrones de pago, modelos de riesgo e incluso detección de fraude.

Figura 1. El manejo del riesgo de crédito

Evolución histórica del cálculo del riesgo de crédito

De manera tradicional se han empleado métodos estadísticos como el análisis de discriminación lineal y la regresión logística para abordar el riesgo de crédito, sin embargo, estos métodos no son fácilmente aplicables a grandes volúmenes de datos (Shi S. 2022) lo que en la actualidad puede rezagar su estimación si son empleados de manera exclusiva.

Con el surgimiento y popularización de técnicas de Machine Learning como KNN (k-nearest neighbors), Random Forest y Support Vector Machine, se aprovechan de mejor manera los grandes volúmenes de información crediticia disponible al ser más flexibles que los métodos estadísticos.

Una perspectiva más contemporánea sobre la evaluación del riesgo de crédito apuesta por técnicas de Deep Learning (aprendizaje profundo) que permitiría obtener mejores resultados tanto en exactitud como en eficiencia a comparación de los métodos estadísticos y las técnicas de ML convencionales.

Técnicas de evaluación del riesgo del crédito

Figura 2. Aproximaciones al riesgo de crédito

A continuación veremos ejemplos de implementación de las tres técnicas de evaluación de riesgo del crédito a los que se hace referencia en la figura 2:

1 Ejemplo de aplicación de un modelo estadístico

> Construcción de ScoreCard

En 1997, Hand & Henley describieron que el proceso estándar para construir una ScoreCard, (un modelo estadístico utilizado para evaluar la probabilidad de impago) involucraba el uso de técnicas como regresión lineal (Orgler 1971), regresión logística (Wiginton 1980) y análisis discriminatorio lineal (Durand 1941). En su análisis se mencionan las diferentes condiciones y situaciones que afectan esta manera de evaluar el riesgo. Por ejemplo, establecer límites muy conservadores para la cesión de un crédito puede implicar el pago siempre puntual de los prestatarios, que, si en principio pudiese parecer un objetivo en el empleo de la herramienta, se debe tener en cuenta que la idea principal es maximizar las ganancias y esto no está exclusivamente relacionado al riesgo. Un prestatario que no tenga ningún retraso no podrá ser cargado con intereses, por lo que el beneficio a partir del mismo se ve reducido. (Hand & Henley, 1997).

Figura 3. Ejemplo ficticio de una ScoreCard

Una manera de validar el modelo estadístico descrito es confrontarlo con un set de test que no ha sido usado para su entrenamiento y esto a su vez nos permite la construcción de, por ejemplo, un diagrama de Lorentz (figura 4) que nos muestra en la curva el porcentaje de “buenos pagadores” aceptados en el eje vertical y en el eje horizontal el porcentaje de impagos aceptados. Un ScoreCard perfecto seguiría el eje vertical izquierdo y el superior indicando que aceptaría al 100% de buenos pagadores antes que ningún impago. Un ScoreCard que tenga una evaluación aleatoria tendría el comportamiento de la línea diagonal.

Figura 4. Diagrama de Lorentz ejemplificativo de la clasificación de un ScoreCard

2 Ejemplos de aplicación de un modelo basado en machine learning

> Ej.1 – Confrontación de modelos convencionales

Sobre los métodos de Machine Learning, Zhenya T, et al. confrontaron modelos convencionalmente usados para la evaluación del riesgo de crédito contra Gradient Boosting Decision Tree (GBDT), que es un algoritmo que ensambla muchos clasificadores “débiles” (árboles de decisión) para obtener un potente y efectivo clasificador. Como parte del método se hacen rondas de iteración que permiten dar un mayor peso a las observaciones negativas (impagos) al mismo tiempo que quita peso a las observaciones positivas, contribuyendo a solventar el problema que representa en estos casos el desbalance de este tipo de bases de datos (Zhenya, 2020).

Los métodos, acompañados de algún inconveniente en este caso, con los que se contrasta el GBDT son:

– Regresión Logística: Es un algoritmo sensible a colinealidad multivariante de variables independientes por lo que una variable podría afectar fuertemente al resto.

– Decision Tree: El resultado de estos modelos puede ser inestable ya que un cambio relativamente pequeño en alguna variable puede conducir a la construcción de un árbol completamente distinto.

– MLP: Multi-layer perceptrón es una red neuronal con estrictos requisitos para selección de variables predictoras y normalización de datos.

– AdaBoost: Selecciona los clasificadores débiles para su combinación ponderada uno a uno, es sensible a los outliers (valores atípicos) que puede afectar de manera importante la precisión de los resultados.

– Random Forest: Combina los resultados de un sumatorio de árboles de decisión, sin embargo, al potencialmente crear árboles similares puede sesgar los resultados reales.

Al someter los diferentes algoritmos en un set de datos de una compañía de evaluación de crédito con alrededor de 50k observaciones y 350 variables, los resultados se muestran en la siguiente tabla:

Tabla comparativa de modelos machine learning en el riesgo de crédito

Figura 5. Comparación del performance de modelos de Machine Learning en riesgo de crédito

Cabe mencionar que distintos problemas deben ser resueltos según el tipo, tamaño y contexto de los datos. En este análisis el algoritmo que ha tenido un mejor performance en función a exactitud y eficiencia es GBDT. Sin embargo, la elección del mejor método de análisis siempre será variable y por lo tanto es recomendable llevar a cabo distintas técnicas para seleccionar la mejor opción según sea el problema.

> Ej.2 – La detección de Fraude en tarjetas de crédito

Otro ejemplo del uso de algoritmos de ML (Machine Learning), es el empleo de Support Vector Machines (SVM) en la detección de fraude. El uso de las tarjetas de crédito ha ido en incremento sustancialmente en las últimas décadas con la implementación del comercio digital, lo que ha impulsado no sólo el número de transacciones, sino también el intento de fraude a través de estos servicios. El fraude como concepto busca la obtención de bienes sin hacer un pago por ellos o tomar fondos de manera no autorizada de una cuenta de crédito. Existen diversas aproximaciones para abordar el problema desde las perspectivas de prevención o detección. De manera general, se usa la información histórica de los clientes como entrenamiento y se buscan eventualidades que sean ajenas al patrón de compra “normal” del cliente.

SVM es un método comúnmente usado para la clasificación y el reconocimiento de patrones que busca la maximización del margen entre dos categorías, en este caso son transacciones fraudulentas o no fraudulentas. Dicho margen se construye como la distancia entre dos hiper planos que minimizan el error de clasificación empleando la función de Lagrange en los casos de datos lineales y se adiciona una función Kernel (Cualquier función que satisfaga la condición Mercer de vapnik) en aquellos no lineales (Dheepa, V., & Dhanapal, R., 2012). El modelo de SVM empleado por Dheepa analiza el patrón de comportamiento de los clientes, clasificando como fraudulentos aquellos movimientos que se desvían del comportamiento usual de compra tomando en cuenta datos como la cantidad de la transacción, fecha, tiempo, sitio, frecuencia de compra y dirección de facturación alcanzando un accuracy mayor al 80% como se muestra en los siguientes gráficos.

Figura 7. Ejemplo de hiper planos realizados por SVM

*La gráfica en dos dimensiones refiere a una R² y en tres dimensiones una R³

3 Ejemplo de aplicación de un modelo de Deep Learning

> Algoritmo ensamblado

De manera breve y simplificada el Deep Learning “DL” es una serie de modelos que tienen capas más profundas y mayor número de unidades dentro de cada capa con respecto a los modelos tradicionales de ML. Oreski, S., & Oreski, G. ejemplifican el uso de DL con la presentación de un modelo híbrido de algoritmo genético, técnicas de filtrado de información y una red neuronal artificial, denominado Hybrid Genetic Algorithm-NN (hablaremos más detalladamente sobre esto en futuras entradas). En su investigación hacen uso del novedoso modelo en dos sets de datos reales de crédito de Croacia y Alemania, demostrando con un nivel de significancia del 1% la hipótesis de su investigación: “la reducción del espacio de búsqueda y la etapa incremental, combinadas con los efectos de la estrategia de generación de población inicial de GA (Genetic Algorithm), dan como resultado la mejora del rendimiento del clasificador.” (Oreski, S., & Oreski, G. 2014).

Figura 8. Flujo de funcionamiento de un algoritmo genético

Consideraciones y conclusiones

Otros modelos pueden seguir el comportamiento de los pagos del cliente a través del tiempo, permitiendo entonces predecir potenciales riesgos que pudieran surgir según cambian las circunstancias sociales/económicas o personales de los mismos.

Hay información que debe tenerse en consideración de manera general en cualquier método que se seleccione para el cálculo de la estimación de riesgo. Las bases de datos pueden tener información faltante (missing values) entre las distintas observaciones, lo que puede dificultar la interpretación de estos valores de manera global en los análisis. Otro punto para considerar es la falta de balance en las bases de datos. Es realmente común, por la naturaleza de la obtención de datos, que la cantidad de observaciones en impago sean mucho menores a los pagadores, lo que puede ser paliado con diversas técnicas que podremos explorar en futuras entradas como el submuestreo y sobremuestreo, sin embargo, el empleo de estas técnicas culmina no siendo totalmente satisfactorio además de que dependerá estrictamente de los datos que se estén usando.

Los modelos también deben ser revisados continuamente para asegurar que siguen siendo eficaces en discernir la probabilidad de impago, pues, así como las circunstancias de los prestatarios evolucionan con el tiempo, es preciso que las herramientas que ayudan a la toma de decisiones se encuentren actualizadas con la información que realmente se adapte a ellos.

La integración de los distintos modelos, así como perspectivas de estos en el campo del riesgo de crédito permean actualmente el sector bancario como se ha plasmado en este artículo. El desarrollo de nuevas técnicas de Machine Learning sigue avanzando para evitar las pérdidas y consecuencias que el fraude y el impago representan, desafortunadamente esto se ve impulsado por un incremento también de intentos por obtener beneficios sin pagar por ellos de muchas personas, lo que mantiene este tópico como uno de prima importancia para las entidades financieras y los clientes.

Finalmente, no hay que perder de vista que el uso de la inteligencia artificial es una herramienta más en la toma de decisiones que puede y debe ser complementada con el conocimiento, la experiencia y el sentimiento por los datos, así logrando obtener resultados robustos y eficaces en conjunto con la tecnología en beneficio de todos como proveedores de servicio y usuarios.

Referencias:

Shi, S., Tse, R., Luo, W. et al. Machine learning-driven credit risk: a systemic review. Neural Comput & Applic 34, 14327–14339 (2022). https://doi.org/10.1007/s00521-022-07472-2

Hand, D. J., & Henley, W. E. (1997). Statistical classification methods in consumer credit scoring: a review. Journal of the Royal Statistical Society: Series A (Statistics in Society), 160(3), 523-541.

Orgler,Y.E.(1970)A credit scoring model for comercial loans. J. Money Credit Bank., Nov., 435 ± 445. – (1971) Evaluation of bank consumer loans with credit scoring models. J. BankRes., spring, 31 ± 37.

Wiginton, J. C. (1980) A note on the comparison of logit and discriminant models of consumer credit behaviour. J. Finan. Quant. Anal., 15, 757 ± 770.

Durand, D. (1941) Risk Elements in Consumer Instalment Financing. New York: National Bureau of Economic Research.

Zhenya Tian, Jialiang Xiao, Haonan Feng, Yutian Wei, Credit Risk Assessment based on Gradient Boosting Decision Tree, Procedia Computer Science, Volume 174, 2020, Pages 150-160, ISSN 1877-0509, https://doi.org/10.1016/j.procs.2020.06.070.

Dheepa, V., & Dhanapal, R. (2012). Behavior based credit card fraud detection using support vector machines. ICTACT Journal on Soft computing, 2(4), 391-397.

Oreski, S., & Oreski, G. (2014). Genetic algorithm-based heuristic for feature selection in credit risk assessment. Expert systems with applications, 41(4), 2052-2064.

Autor:

Irving Ramirez, Quantitative Analyst

Publicaciones

Evolución histórica del cálculo del riesgo de crédito

1 Ejemplo de aplicación de un modelo estadístico

> Construcción de ScoreCard

2 Ejemplos de aplicación de un modelo basado en machine learning

> Ej.1 – Confrontación de modelos convencionales

> Ej.2 – La detección de Fraude en tarjetas de crédito

3 Ejemplo de aplicación de un modelo de Deep Learning

> Algoritmo ensamblado

Consideraciones y conclusiones

Te puede interesar

Te puede interesar

QUIÉNES SOMOS

QUÉ HACEMOS

TARIFAS

PUBLICACIONES

CONTACTO

LEGAL

QUIÉNES SOMOS

QUÉ HACEMOS

TARIFAS

PUBLICACIONES

CONTACTO

Legal

Publicaciones

Evolución histórica del cálculo del riesgo de crédito

1 Ejemplo de aplicación de un modelo estadístico

> Construcción de ScoreCard

2 Ejemplos de aplicación de un modelo basado en machine learning

> Ej.1 – Confrontación de modelos convencionales

> Ej.2 – La detección de Fraude en tarjetas de crédito

3 Ejemplo de aplicación de un modelo de Deep Learning

> Algoritmo ensamblado

Consideraciones y conclusiones

Te puede interesar

Sistema asesor trading cuantitativo

Fondos de inversión TECH o tecnológicos

Valor en Riesgo por Montecarlo (VaR using Monte Carlo Simulation)

Te puede interesar

Sistema asesor trading cuantitativo

Fondos de inversión TECH o tecnológicos

Valor en Riesgo por Montecarlo (VaR using Monte Carlo Simulation)

QUIÉNES SOMOS

QUÉ HACEMOS

TARIFAS

PUBLICACIONES

CONTACTO

LEGAL

QUIÉNES SOMOS

QUÉ HACEMOS

TARIFAS

PUBLICACIONES

CONTACTO

Legal