MLOps en el sector financiero

MLOps en el sector financiero: cómo gestionar la deriva y mantener modelos fiables

En el artículo anterior (Devops en el sector financiero) vimos, a través de un caso práctico, cómo DevOps, Agile y CI/CD catalizan el desarrollo de un producto de software. Ese caso se centraba en construir una aplicación full stack en forma de dashboard para ayudar al equipo gestor a tomar decisiones de inversión. 

 

¿Por qué MLOps es clave en el sector financiero?

Supongamos ahora que el equipo gestor pide al equipo FinTech aplicar técnicas de machine learning para predecir ratios financieros, enriqueciendo la aplicación con nuevas gráficas más reveladoras. Para ello, el equipo deberá diseñar, entrenar y desplegar modelos adecuados a la fuente de datos y a la predicción deseada. 

A diferencia del desarrollo de software tradicional, el desarrollo de modelos de ML plantea desafíos propios (gestión de datos, experimentación, monitorización y reentrenamiento), por lo que conviene apoyarse en la cultura MLOps, que extiende los principios de DevOps. 

 

¿Qué es la deriva (drift) en modelos de machine learning?

Una característica fundamental de los modelos en producción es que comienzan a degradarse desde el momento mismo en que se ponen en marcha. Esta degradación se debe a un fenómeno denominado deriva (drift): cambios que pueden afectar a la estructura, la distribución o el significado de los datos, así como a la relación entre variables de entrada y salida. Esa deriva se puede clasificar, principalmente, en: 

  • Data drift: se produce cuando la distribución de las variables de entrada (features) cambia a lo largo del tiempo, aunque la relación entre estas y la variable objetivo (target) permanezca estable. 

Ejemplo: si la distribución del ratio deuda/capital de las empresas se desplaza de un año a otro porque las empresas se endeudan más, un modelo entrenado con datos anteriores perderá precisión, aunque la relación entre deuda y riesgo no haya cambiado. 

  • Concept drift: ocurre cuando cambia la relación entre las variables de entrada y la variable objetivo. Es decir, el patrón que el modelo aprendió deja de ser válido. 

Ejemplo: durante la pandemia, la rentabilidad de las empresas pasó a depender en mayor medida de su sector de actividad que de su estabilidad financiera. 

📌Si necesitas repasar fundamentos estadísticos básicos, consulta este artículo (Predicción Financiera) para entender fundamentos de estadística). 

 

¿Cómo mitigar la deriva en modelos de ML?

Para contrarrestar la deriva y evitar que un modelo en producción se degrade con el tiempo. Es fundamental testearlo periódicamente con datos recientes, reentrenarlo de forma regular y establecer alertas que monitoricen cambios en sus propiedades y en la calidad de los datos. 

La forma en que un equipo FinTech aborda estos problemas depende de su nivel de madurez: 

  • Equipos jóvenes: el reentrenamiento y ajuste del modelo se realiza en Jupyter Notebook. El build y el despliegue también se lanza manualmente, por lo que el modelo se actualiza con poca frecuencia. Este enfoque es frágil y poco escalable en entornos tan dinámicos como el financiero. 
  • Equipos maduros: incorporan entrenamiento continuo (CT), lo que permite reentrenar el modelo con datos recientes en producción. Además, cuentan con módulos de CI y CD sólidos, que permiten a los data scientists explorar nuevas ideas (como feature engineering, cambios de arquitectura o ajustes de hiperparámetros…) y llevarlas a producción de forma controlada y ágil. 

 

MLOps Finance

Figura 1. Pipeline MLOps que integra CI/CT/CD y monitorización continua. El proceso comienza con la integración y validación de código (CI), seguida de un pipeline automatizado de entrenamiento (CT) que asegura calidad y reproducibilidad. Tras la validación, el modelo se despliega en producción (CD) y se monitoriza su rendimiento para detectar drift. Si se observa degradación, se activa un trigger que reinicia el ciclo de reentrenamiento. 

 

La figura 1 muestra una versión simplificada de la arquitectura de un equipo maduro. Un principio fundamental de este enfoque es mantener simetría entre el pipeline de entrenamiento automatizado en producción y el pipeline experimental desarrollado localmente. Los flujos operacionales y experimentales permanezcan alineados. 

Este enfoque de MLOps no sólo mantendrá los modelos actualizados, robustos y fiables para el equipo gestor, sino que también acortará el ciclo de innovación. Reducirá la dependencia de tareas manuales y mejorará la capacidad de respuesta frente a cambios en el mercado. 

TE PUEDE INTERESAR

Qué es DevOps

¿Qué es DevOps y cómo se aplica en el sector financiero?

DevOps en el sector financiero  El equipo gestor de un fondo de inversión solicita al área de Fintech una app…

RAG en finanzas:

RAG en finanzas: ¿Qué es y cómo funciona?

Introducción Un factor clave en los mercados financieros es poder extraer la mayor cantidad de información relevante en el menor…

Introducción al procesamiento del Lenguaje Natural en finanzas

Esta arquitectura forma parte de la rama de conocimiento denominada Procesamiento del Lenguaje Natural (PLN) o en inglés Natural Language…

TE PUEDE INTERESAR

Qué es DevOps

¿Qué es DevOps y cómo se aplica en el sector financiero?

DevOps en el sector financiero  El equipo gestor de un fondo de inversión solicita al área de Fintech una app…

RAG en finanzas:

RAG en finanzas: ¿Qué es y cómo funciona?

Introducción Un factor clave en los mercados financieros es poder extraer la mayor cantidad de información relevante en el menor…

Introducción al procesamiento del Lenguaje Natural en finanzas

Esta arquitectura forma parte de la rama de conocimiento denominada Procesamiento del Lenguaje Natural (PLN) o en inglés Natural Language…