Introducción
Un factor clave en los mercados financieros es poder extraer la mayor cantidad de información relevante en el menor tiempo posible. Un sistema de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) es una idea relativamente nueva basada en el Procesamiento del Lenguaje Natural (NLP), del cual hablamos en nuestro último artículo. A lo largo de este artículo, exploraremos cómo funciona un RAG, cuáles son sus componentes esenciales y por qué es tan útil en el sector financiero.
¿Qué es la Generación Aumentada por Recuperación (RAG)?
Un RAG es un tipo de Agente de IA que se basa en un modelo de lenguaje al que se le da las herramientas adecuadas para poder acceder a fuentes de datos externas. Las fuentes de datos pueden contener archivos en un único formato o en múltiples (multimodalidad) como pueden ser PDFs, imágenes o incluso bases de datos.
Fuente: Elaboración propia
- Knowledge Base (base de conocimiento): Conjunto de archivos en diferentes formatos como imágenes, audios, archivos de texto, base de datos…
- Retriever (o recuperador): Se encarga de buscar y recopilar documentos o datos relevantes. Para ello, primero convierte la consulta del usuario en un embedding. Este embedding se compara con los embeddings de los archivos de la base de conocimiento. Al medir la similitud entre los dos vectores, el retriever localiza y selecciona los documentos más relacionados con la consulta.
- Generator (Generador): Con los documentos recuperados el sistema emplea la información contenida en ellos para generar respuestas coherentes. Para ello utiliza modelos de lenguaje avanzados como R1 de DeepSeek o GPT-4, que integran los datos recopilados con la consulta original del usuario y producen respuestas precisas.
Ejemplo – Sistema RAG para Manejo de Información de Riesgo de Crédito
- Consulta del Usuario: “Proporcione las últimas métricas de riesgo de crédito para la empresa Quant.”
- Embeddings: El sistema convierte la consulta en embeddings.
- Retriever: Examina la información de los arvhivos cargados (informes de crédito, evaluaciones de préstamos y estados financieros) mediante la similitud de sus embeddings.
- Generación de Respuestas: El Modelo de Lenguaje (LLM) combina la información extraída para formular una respuesta clara: “Las últimas métricas de riesgo de crédito de la empresa Quant muestran una tasa de incumplimiento del 5%, lo que indica posibles vulnerabilidades en ese sector.”
Fuente: Elaboración Propia
Ejemplos de cómo los RAGs ayudan a las Finanzas
- Evaluación de Riesgo de Crédito: Localiza y analiza de manera rápida la información en solicitudes de préstamo, registros crediticios e informes financieros.
- Mejores Decisiones de Inversión: Respalda a los equipos de inversión al recopilar datos de informes anuales, actualizaciones de ganancias y tendencias de mercado.
- Cumplimiento y Reportes Eficientes: Localiza y resume las nuevas normativas o actualizaciones en las políticas.
Conclusión
La Generación Aumentada por Recuperación (Retrieval-Augmented Generation) gestiona y procesa un gran volumen de datos de manera eficiente. Al definir un agente que combina la capacidad de búsqueda en archivos privados y la potencia de modelos de IA generativa, los sistemas RAG ayudan en facetas del sector como la evaluación de riesgo de crédito o el análisis de inversiones. Si te ha parecido interesante, en el próximo artículo profundizaremos en distintos tipos de RAG y cuales ofrecen mejores prestaciones para según qué casos de uso.