La tecnología Machine Learning es aprovechada por bancos y otras instituciones financieras para detectar actividad sospechosa de forma rápida y a gran escala. Los modelos de Machine Learning son útiles para identificar fraude potencial que hay que conviene analizar y para detectar comportamientos sospechosos antes de que el fraude ocurra.
Esto quiere decir que se confía el modelo de Machine Learning como tal para la detección de fraude, por lo que recae una gran responsabilidad sobre el modelo en sí mismo. Por este motivo, tanto analistas de fraude como ejecutivos necesitan entender como funcionan los modelos y cual es su efectividad, es fácil decirlo, pero más complicado llevarlo a cabo.
Hay que tener en cuenta que el Machine Learning es altamente complejo y realiza gran cantidad de cálculos a gran velocidad y a mayor escala de que lo que los humanos son capaces.
En este artículo, desde Featurespace se explicará cómo los modelos de Machine Learning son usados para detectar fraude hoy en día y cuáles son los resultados que estamos viendo desde las nuevas generaciones de modelos de Machine Learning.
¿Por qué usar modelos de Machine Learning en la detección del fraude?
El fraude lleva existiendo desde que existe el dinero. Durante la mayor parte de la historia de los bancos, la detección del fraude era un proceso manual y tedioso.
Al final del siglo XX la tecnología proporcionó a las organizaciones herramientas y procesos para automatizar la detección del fraude. Estas eran sistemas básicos basados en reglas simples del tipo «alerta si una transacción es mayor de $10.000 para su revisión manual». Mediante la aplicación de Machine Learning podemos identificar cuales de las transacciones mayores de $10.000 pueden tener un riesgo más elevado.
El problema de los sistemas basados en reglas es su poca rigidez. Las reglas son creadas de forma retroactiva y deben ser actualizadas a medida que el comportamiento de los clientes y de los defraudadores cambia. Este es también es un proceso lento y costoso.
Los nuevos modelos de Machine Learning resuelven este problema aportando dinamismo a la detección de fraude. Por ejemplo, los modelos de Análisis de comportamiento conductual (Adaptive Behavioral Analytics) de Featurespace introducen autoaprendizaje automatizado que estudia el comportamiento de las transacciones. Estos modelos aprenden de sí mismos qué tipos de transacciones de los clientes son normales y cuales son anómalas.
Cuantas más transacciones examina el modelo, mayor es su precisión. En lugar de revisar reglas estáticas de forma periódica, el Análisis del Comportamiento Adaptativos se vuelve más efectivo con el tiempo.
Como resultado, el modelo es capaz de decidir en tiempo real la probabilidad de que la actividad sea fraudulenta o genuina.
Esta nueva generación de Machine Learning ha convertido la detección de fraude en:
- Más rápida.
- Aplicable a gran escala.
- Más efectiva.
- Menos intrusiva para los clientes bancarios.
¿Cómo funciona el Machine Learning en la detección de fraude?
Cómo funcionan los modelos de Machine Learning puede ser complicado de explicar. Funciona de una forma tan rápida y a una escala tan grande que los humanos pueden tener dificultades para explicarlo con palabras. Es por esto por lo que la explicabilidad del modelo (ser capaces de explicar en una conversación lo que el modelo de Machine Learning está haciendo realmente), es tan importante en la detección del fraude.
Podemos hablar de detección de fraude a través de Machine Learning considerando tres pasos básicos:
Entrada de datos
Un modelo de Machine Learning necesita una gran cantidad de datos, cuantos más, mejor. Por suerte en banca y finanzas se generan una cantidad ingente de datos a diario por la propia naturaleza de su actividad. En la detección de fraude, un ejemplo de fuente de datos podría ser las transacciones monetarias, incluyendo quien envía el dinero, quien lo recibe, cuando fue realizado el envío, etc.
Identificación y extracción de características
En Machine Learning, característica es cualquier tipo de inteligencia obtenida de los datos en bruto. Por ejemplo, un algoritmo de detección de fraude puede dividir cada transacción que realiza un cliente por el valor medio de las transacciones de ese mismo cliente. Eso es una característica, y eso es el núcleo donde reside la inteligencia que el modelo puede usar para predecir si la transacción es sospechosa.
Es entonces cuando el modelo de Machine Learning desmenuza la información histórica para determinar si esa característica representa un comportamiento normal o anormal.
Tomemos la característica que hemos descrito anteriormente, valor de la transacción dividido entre la media del valor de las transacciones. Llamemos a ese valor X.
Peso de la característica en el modelo
Ahora imaginemos que el modelo encuentra que, históricamente, las transacciones mayores o iguales que X han sido fraudulentas el 20% de las veces. Esta información afecta a la predicción del modelo para evaluar si se trata de una transacción sospechosa. De la misma forma, características pueden indicar que una determinada transacción es más probable que sea genuina o legítima.
Dependiendo de la fuerza de la característica al indicar si la transacción es sospechosa o genuina, un peso es asignado a cada característica en el modelo, las cuales de forma conjunta determinaran la probabilidad de que la transacción sea fraudulenta.
La clasificación es un proceso de prueba y error. A medida que el modelo fragmenta y analiza más y más datos, este es más preciso en su predicción. Así es como un modelo de Machine Learning se entrena a sí mismo y consigue finalmente un nivel de rendimiento preparado para su implementación.
Esta optimización se consigue mediante la repetición de los pasos previamente explicados de forma continua para permitir mejoras en el rendimiento del modelo gracias a nuevos datos e inteligencia extraída de estos.
¿Dónde encaja el Deep Learning dentro de la detección de fraude?
En la última década, los científicos de datos han investigado posibilidades que aumenten las capacidades del Machine Learning, esto se está haciendo mediante la investigación en el campo del Deep Learning.
Deep Learning se apoya en redes neuronales diseñadas para identificar patrones ocultos en la entrada de datos.
En el Machine Learning tradicional, el aprendizaje tiene lugar en los pasos de clasificación y optimización del modelo. Con redes neuronales, el aprendizaje real empieza en el paso de extracción de las características. Esto produce modelos que son más inteligentes que los anteriores, y contienen menos sesgo humano en el momento del diseño de extracción de características.
Un ejemplo de cómo el Deep Learning puede aplicarse a la detección de fraude son los Automated Deep Behavioral Networks de Featurespace que ya están mostrando una mejora en la detección y la prevención.
¿Cómo pueden los modelos de Machine Learning de Featurespace ayudar a los negocios?
Numerosos bancos y otras entidades financiaras ya han desplegado la solución ARIC Risk Hub de Featurespace para monitorizar transacciones y detectar anomalías mediante su sistema de Analítica de Comportamiento Conductual (Adaptive Behavioral Analytics).
A continuación, mostramos solo algunos ejemplos:
- La compañía de pagos globales TSYS redujo sus pérdidas por fraude un 39% y la tasa de falsos positivos un 34% tras desplegar ARIC Risk Hub con capacidades de toma de decisión en tiempo real.
- El banco líder de Reino Unido, Natwest, desplegó ARIC Risk Hub en toda la organización para una mejor gestión en la detección y prevención del fraude. En las primeras 24 horas de operación, Natwest ya observó un aumento en la detección de estafas y un descenso en el volumen de falsos positivos.
- Danske Bank, el banco más grande de Dinamarca utiliza las capacidades de Machine Learning de ARIC Risk Hub para la detección de fraude en tarjetas y la reducción de falsos positivos, así garantizan la mejor experiencia de usuario a sus millones de clientes.
Para aprender más sobre el rendimiento de los modelos de Featurespace en grandes organizaciones, podéis echar un ojo al video de la presentación del fundador Dave Excell:
Conoce más sobre la protección contra fraude de primera persona o autofraude
Los modelos de Machine Learning de Featurespace están construidos para ayudar a las organizaciones a detectar y prevenir el fraude. ARIC Risk Hub monitoriza en tiempo real los datos del cliente para identificar comportamientos anómalos y ayuda a los equipos de analistas a priorizar las alertas de fraude.
Para conocer más sobre cómo ARIC™ Risk Hub puede apoyar en la detección y prevención de fraude de primera persona o autofraude para su negocio, contacta con nosotros o solicita una demo hoy mismo.
Share