Las herramientas de aprendizaje automático para la detección de fraudes se utilizan en muchas industrias para descubrir y mitigar transacciones fraudulentas de forma rápida, eficiente y a escala.
El fraude es una amenaza demasiado grande como para que cualquier organización la ignore, especialmente en el sector bancario y financiero , pero también en sectores como la salud, los seguros y el comercio minorista. Una estrategia exitosa de gestión del fraude requiere la adopción de tecnologías de inteligencia artificial (IA) y aprendizaje automático (ML) de vanguardia. Las herramientas de aprendizaje automático para la detección de fraudes ayudan a organizaciones de diversos sectores a detectar y mitigar transacciones fraudulentas de forma rápida, eficiente y a gran escala.
Aprendizaje automático para la detección de fraudes: aspectos esenciales
La cualidad que hace que los algoritmos de aprendizaje automático (y las soluciones que potencian) sean ideales para combatir el fraude es su capacidad de aprender y mejorar continuamente a través de un uso constante.
Algoritmos de entrenamiento y modelado
Para la detección de fraudes, la implementación del aprendizaje automático comienza con la fase de entrenamiento, en la que se le enseña al algoritmo de aprendizaje automático a reconocer las señales de una transacción fraudulenta. Esto requiere la ingestión de grandes conjuntos de datos con el historial de transacciones fraudulentas. Una vez entrenado exhaustivamente, el algoritmo comenzará a desarrollar la capacidad de aprender nuevos patrones y anomalías indicativas de fraude, más allá de los que originalmente estaba programado para detectar.
La complejidad necesaria para detectar actividad fraudulenta en la banca, las finanzas y otros sectores implica que se utilicen distintos modelos de aprendizaje automático (y métodos de entrenamiento) para este propósito.
- Por ejemplo, la creación de un modelo de aprendizaje automático de regresión logística para detectar patrones de fraude que se ven comúnmente en estafas por correo electrónico de phishing requiere los conjuntos de datos etiquetados que se utilizan en el método de entrenamiento de aprendizaje automático supervisado.
- Por el contrario, los modelos de detección de fraude de robo de identidad, como el bosque de aislamiento, se entrenan mejor a través del aprendizaje no supervisado, en el que los datos de entrenamiento se basan en un comportamiento normal predeterminado.
- Otros algoritmos y modelos de aprendizaje automático notables para la detección de fraude incluyen máquinas de vectores de soporte (SVM), factores de valores atípicos locales (LOF) e incluso versiones automatizadas y muy avanzadas de técnicas clásicas de exploración de datos como el vecino más cercano K (KNN).
Cómo los algoritmos de aprendizaje automático detienen el fraude
La escala y el alcance son posiblemente los factores más importantes que impulsan a los equipos antifraude de numerosos sectores a incorporar el aprendizaje automático en sus operaciones de prevención y detección del fraude. En el mundo empresarial, se producen muchísimas transacciones en un momento dado: cientos de reclamaciones de seguros en trámite, miles de autorizaciones sanitarias solicitadas, millones de transacciones con tarjetas de débito y crédito, etc.
Detectar fraudes en medio de todo esto simplemente no es posible sin una automatización de alto nivel, debido al volumen de datos involucrado. Un sistema moderno de aprendizaje automático no solo está diseñado para gestionar tales volúmenes de datos, sino también para prosperar y mejorar su rendimiento a medida que ingiere y procesa más información.
En un mundo donde los estafadores lanzan nuevas estafas a un ritmo vertiginoso, los profesionales antifraude necesitan una herramienta que evolucione y mejore con el tiempo. Incluso cuando un algoritmo de detección de fraude basado en aprendizaje automático (ML) no puede reconocer una estafa antes de que sea demasiado tarde, cada punto de datos de ese fallo contribuirá a detener futuros fraudes. Examina la transacción en busca de detalles nunca antes vistos y los compara con datos históricos. En sectores importantes como el comercio electrónico, donde hay menos variedad en los tipos de fraude que experimentan las empresas , la probabilidad de que las soluciones de ML identifiquen un patrón y sepan detener transacciones similares la próxima vez es alta.
Cinco casos clave de uso del aprendizaje automático antifraude
Anteriormente, mencionamos algunas de las maneras notables en que un modelo de aprendizaje automático puede combatir el fraude. Aquí, examinaremos esos casos de uso con más detalle.
1. Detección de phishing
A menudo considerado como un vector de malware, el phishing también puede ser fácilmente un medio para fraudes sutiles con fines de lucro. Las estafas de impostores, identificadas por la Comisión Federal de Comercio (FTC) como el tipo más común de fraude al consumidor , pueden afectar con la misma facilidad a un director ejecutivo que a un trabajador de la construcción jubilado. Los estafadores atacan a personal ejecutivo con tanta frecuencia que existe un término coloquial para ello: «pesca de ballenas».
Los empleados de empresas también pueden ser blanco masivo de ataques de phishing, en un tipo de estafa conocido como fraude de correo electrónico empresarial (BEC). Según el FBI, las empresas perdieron 43 000 millones de dólares entre 2016 y 2021 como resultado de este tipo de fraude.
Los modelos de aprendizaje automático pueden detectar y prevenir el fraude de phishing. Mediante el aprendizaje supervisado con conjuntos de datos etiquetados, los ingenieros de aprendizaje automático programan estos modelos para identificar las principales señales de alerta de enlaces de phishing: antigüedad del sitio, posicionamiento de página, registro de dominio, ausencia de un token HTTPS, etc.
2. Prevención del robo de identidad
Hay ocasiones en las que prevenir el robo de identidad es relativamente sencillo, ya que se gestiona mediante sistemas tradicionales basados en reglas. Imagine un intento de inicio de sesión desde una ubicación desconocida, que activa un proceso de autenticación multifactor.
Pero, en la mayoría de los casos, el robo de identidad es mucho más complejo. El robo de identidad sintético, donde se mezclan datos falsos con fragmentos de identidades reales , es cada vez más común, al igual que la usurpación de cuentas. Esta última, que implica el robo de credenciales a gran escala, es especialmente perniciosa, ya que puede permitir a los delincuentes robar fondos de desempleo y otras prestaciones gubernamentales cruciales.
Los sistemas de aprendizaje automático (ML) combaten el robo de identidad partiendo de los resultados o condiciones predeterminados que se observan en la detección tradicional de fraude basada en reglas (mediante aprendizaje no supervisado) y ampliando gradualmente sus parámetros para construir un sofisticado árbol de decisiones. Si bien estas herramientas de ML no pueden predecir si una identidad será robada, los algoritmos detectan rápidamente correlaciones y anomalías y las agrupan para que se distingan de los patrones esperados. Esto permite al personal antifraude comprender dónde existen vulnerabilidades en la protección de la identidad, de modo que todo el equipo de seguridad pueda trabajar para mitigarlas.
3. Fraude con tarjetas de débito y crédito
A mediados de 2021, había aproximadamente 2.300 millones de tarjetas en circulación, solo de Visa y Mastercard, según un estudio de la revista Human-Centric Intelligent Systems. Por lo tanto, es imposible exagerar los riesgos que plantea el fraude con tarjetas de débito y crédito. Este peligro afecta principalmente a consumidores, bancos, principales compañías de tarjetas de crédito y las tres grandes agencias de crédito (Experian, Equifax y TransUnion), pero también representa una gran amenaza para las cadenas minoristas que emiten tarjetas de marca.
Numerosas técnicas de aprendizaje automático (ML) pueden ayudar a detectar y prevenir el fraude. Algunas de ellas se basan en el aprendizaje supervisado, como KNN, SVM y el bosque aleatorio (una variante del bosque de aislamiento). Las redes neuronales artificiales (RNA) no supervisadas también se utilizan a veces en este caso de uso debido a su precisión y tolerancia a fallos. Una institución financiera probablemente se beneficiará más utilizando una combinación de métodos supervisados y no supervisados en lugar de optar por un solo enfoque.
4. Mitigación del fraude en la nómina
Aunque el fraude de nóminas mediante la cámara de compensación automatizada (ACH) es más común en pequeñas empresas que en grandes empresas, prácticamente cualquier organización puede ser víctima de este tipo de estafa. El fraude de nóminas puede ser obra tanto de autores internos (los empleados estafadores que causaron el 31 % de los incidentes graves de fraude empresarial entre 2020 y 2022, según PwC) como de actores maliciosos externos. De hecho, puede ser incluso más fácil perpetrar un trabajo interno y más difícil detectarlo.
Mediante un análisis exhaustivo basado en aprendizaje automático (ML), las empresas pueden ampliar su capacidad para detectar transacciones ACH sospechosas, superando con creces la capacidad de los métodos tradicionales de detección de fraude basados en reglas. Un algoritmo de ML puede identificar tanto fraudes ACH por manipulación de lotes (por ejemplo, cambios repentinos en los números de cuenta o destinatarios de pagos previamente desconocidos) como el robo de cuentas ACH, que suele deberse a inicios de sesión corporativos comprometidos.
5. Detección de falsificaciones
Los estafadores pueden encontrar maneras de falsificar identificaciones emitidas por el gobierno (licencias de conducir, identificaciones estatales, etc.) y otros documentos oficiales. Esto suele implicar la falsificación de firmas o imágenes. Si bien este tipo de fraude es extremadamente difícil de llevar a cabo, los estafadores aún lo intentan, ya que es imposible predecir el daño que pueden causar en la vida de los consumidores y en las ganancias de las empresas si tienen éxito.
Una estafa verdaderamente compleja requiere un método de detección igualmente complejo, y eso es precisamente lo que ofrece el subconjunto avanzado del aprendizaje automático, conocido como aprendizaje profundo. Técnicas como el procesamiento del lenguaje natural (PLN) y la visión artificial son esenciales para identificar las anomalías visuales que revelarán una firma o imagen de identificación falsa. Una red neuronal convolucional (CNN) con múltiples capas ocultas es la más adecuada para detectar estos valores atípicos.
Principales beneficios de los sistemas de aprendizaje automático para la detección de fraudes
Detección más rápida
Si bien los sistemas de ML requieren una gran cantidad de datos para entrenarse y una gran capacidad de procesamiento para completar sus cálculos, prácticamente no hay ningún escenario en el que sean más lentos que un ser humano para detectar el fraude.
Precisión mejorada
Ya sean falsos negativos o falsos positivos, la inexactitud en la detección del fraude debe ser lo menos frecuente posible. Al reducir drásticamente la probabilidad de que errores humanos o sesgos comprometan los datos necesarios para la detección del fraude, el aprendizaje automático (ML) ayuda a garantizar que el fraude se detecte exactamente en el momento en que ocurre, idealmente, antes de que se procese la transacción fraudulenta. Por ejemplo, Human-Centric Intelligent Systems identificó una tasa de precisión del 95 % para las ANN utilizadas en la detección de fraudes con tarjetas de crédito.
Una estrategia más fuerte
La prevención del fraude va mucho más allá de detectar y detener proactivamente las amenazas. Con el apoyo de algoritmos de aprendizaje automático y un análisis exhaustivo de los indicadores clave de rendimiento (KPI) relacionados con transacciones o reclamaciones potencialmente fraudulentas, los líderes empresariales pueden identificar las debilidades de sus sistemas y estar mejor preparados para corregirlas. Esto también facilita el análisis de riesgos, lo que ayuda a las organizaciones a evitar posibles fuentes de fraude: personas con historial crediticio dudoso, empleados con historiales turbios, propuestas comerciales que parecen demasiado buenas para ser ciertas, etc.
Cómo las empresas tienen éxito con la detección de fraude basada en ML
Dos de los clientes más antiguos de Teradata ofrecen excelentes ejemplos de sistemas de aprendizaje automático para detección de fraude en acción:
Banco Danés
A pesar de su larga trayectoria —casi un siglo y medio en el mercado—, Danske Bank no es nada anticuado. El banco regional nórdico se dio cuenta a mediados de la década de 2010 de que los sistemas de detección de fraude basados en reglas, con políticas totalmente escritas por personas, no eran adecuados para una era dominada por la banca en línea y móvil. Danske solo identificaba el 40 % de sus casos de fraude con los motores de reglas tradicionales.
Con el apoyo de Teradata Consulting, Danske modernizó su detección de fraude mediante la implementación de una solución moderna de análisis empresarial junto con herramientas de aprendizaje profundo. Esto elevó su tasa de detección de fraude por encima del 80 %. Analistas de fraude humanos supervisaron cuidadosamente el nuevo modelo como medida de seguridad, pero la nueva tecnología finalmente reforzó el valor de la detección de fraude del banco para sus clientes.
Banco de EE. UU.
A través de su relación con Teradata, US Bank se dio cuenta de que el análisis de fraude impulsado por algoritmos de IA y ML representaba la única forma segura de proteger a sus millones de clientes del fraude de la manera más eficaz posible.
La solución que ambas partes idearon, que permitió una monitorización meticulosa en tiempo real de los KPI de las transacciones, permitió al banco buscar constantemente tanto indicadores de fraude conocidos como nuevas anomalías, una necesidad absoluta en un mundo donde los estafadores intentan constantemente nuevas estafas. Esto benefició no solo a su base de clientes minoristas, sino también a los numerosos clientes de sus instrumentos financieros basados en bonos del Tesoro.
Pase de la detección de fraude a la prevención del fraude con ML y análisis en la nube
Detectar el fraude es crucial, especialmente cuando permite detener una estafa antes de que se produzcan daños. Pero la verdadera prevención del fraude se basa tanto en la estrategia como en la detección y el bloqueo de los estafadores en tiempo real. Esto requiere una visión verdaderamente unificada de los datos transaccionales y de comportamiento, así como modelos de aprendizaje automático capaces de analizar el riesgo de fraude con suficiente antelación.
Las robustas soluciones de prevención del fraude de Teradata combinan un análisis exhaustivo de datos de comportamiento propios (interacción digital, tiempo, ubicación, etc.) de múltiples canales con la capacidad de crear y probar modelos de prevención del fraude basados en IA y ML. Con la recopilación de datos de Celebrus integrada en la funcionalidad ampliada de análisis nativo en la nube de Teradata VantageCloud , las empresas se sientan como bases sólidas para construir y mantener una estrategia duradera de prevención del fraude.
Aria PSW partner de Teradata: creamos soluciones digitales a la medida.
Contáctanos y te diremos cómo lo hacemos.
Compartelo en tus redes sociales.
