Analytics na Prevenção à Lavagem de Dinheiro

Disponibilizado em 17/03/2020


A adoção de ferramentas de analytics na identificação de anomalias

O crescimento do volume de dados gerados e da capacidade de processamento dos computadores foram fatores determinantes para a grande expansão da ciência de dados em diversas áreas do mercado. Entre elas está a crescente utilização nos Programas de Prevenção à Lavagem de Dinheiro e Financiamento ao Terrorismo (PLD-FT). A aplicação de analytics pode desempenhar um papel fundamental em um dos maiores desafios do combate à lavagem de dinheiro: a Identificação de Anomalias.

Centenas de milhares de informações de clientes precisam ser analisadas diariamente, tais como dados cadastrais, transacionais ou de relacionamento entre indivíduos e entidades. Na maior parte dos casos, identificar uma operação que fuja do padrão de normalidade é um fenômeno raro. Torna-se praticamente impossível se considerarmos apenas a análise humana. O uso de ferramentas de analytics para reduzir os eventos de falso positivo¹ torna-se um grande aliado na solução do desafio na prevenção à lavagem de dinheiro. 

A aplicação de soluções de analytics possibilita uma correlação mais rápida e completa dos dados, sempre considerando uma maior variedade de informações. A agilidade também permite aumentar a assertividade e, consequentemente, baixar o número de alertas falsos para a validação dos profissionais que atuam nos programas de PLD-FT. Com mais informações à disposição e inteligência extraída dos dados, os analistas conseguem, ainda, capturar novos riscos ou até identificar novas tipologias de lavagem de dinheiro.

 

5 grandes desafios no tratamento de anomalias

Utilizar as ferramentas de analytics na identificação e tratamento das anomalias não é uma tarefa simples. É essencial que as equipes que trabalham no desenvolvimento de modelos e políticas de risco considerem algumas situações específicas para resolver os desafios de captura de eventos de lavagem de dinheiro. 

  1.    1. Mapeamento de situações normais 

Definir uma região normal, que englobe todos os comportamentos normais possíveis, é uma tarefa muito difícil! As instituições precisam ter essa relação mapeada para facilitar a identificação e discriminação do risco. Por exemplo: sobre o padrão de gasto dos clientes de uma determinada operadora de cartão de crédito. Há inúmeras situações previsíveis, como a concentração de pagamentos na data de fatura ou a consumo atípico em datas festivas. Situações que se enquadram como normais devem ser consideradas numa análise de cenários de investigação.

 

  1.     2. Histórico de informações classificadas

A disponibilidade de dados de risco classificados para treinamento de algoritmos acarreta grandes desafios na prevenção de lavagem de dinheiro. Por exemplo, imagine uma situação envolvendo um novo produto. Se a instituição não possui um histórico de classificações de risco de lavagem de dinheiro, resulta uma dificuldade maior de se prever eventos semelhantes em futuras transações. Por conta disso, muitas vezes é utilizado um perfil de risco já conhecido para inferir situações parecidas nesse novo produto.

 

  1.     3. Ruído nos dados

Muitas informações podem ser consideradas semelhantes a um comportamento anormal, mas, quando analisadas, podem não ser. Por exemplo, sobre a ausência de informações. Há situações em que o cadastro do cliente não está completo ou os dados foram parcialmente atualizados. Isso pode acarretar um erro na classificação do cliente, que poderá ser considerado um caso de manipulação intencional das informações.

 

  1.     4. Atualização constante de cenários

O risco de mudança repentina da classificação de normalidade para anormalidade (ou vice-versa) pode ser frequente. Para garantir o uso correto das informações quando isso ocorre, é fundamental a reestimação contínua do modelo. Por exemplo: sobre investigação em operações de mercado de capitais. Algumas situações que hoje parecem ser atípicas podem ser consideradas normais num futuro próximo motivada por uma mudança de condição do mercado. 

 

  1.     5. Sazonalidade

É fundamental a identificação de períodos em que há potencial mudança de comportamento do cliente. O efeito sazonal ou eventos específicos podem levar a conclusões erradas e a um aumento do número de falsos positivos. Por exemplo: sobre o aumento inesperado de renda de um cliente. Esta nova renda pode ser decorrente de pagamentos extras como décimo terceiro salário ou o recebimento de incentivos, como a participação de lucros dos empregadores.

 

¹Falsos negativos x Falsos positivos

Estes termos são frequentemente utilizados nos programas de PLD-FT e aparecerão constantemente nesta série de artigos. Dada sua relevância, a seguir introduzimos uma discussão mais técnica sobre o assunto.

Para explicar o conceito de falso positivo e falso negativo precisamos recorrer à matriz de confusão (tabela 1). As colunas da tabela representam a situação verdadeira, ou seja, o indivíduo de fato cometeu ou não um crime de lavagem dinheiro. Enquanto as linhas representam a situação definida pelos modelos ou alertas, ou seja, é estimado que o indivíduo apresente risco ou não de crime de lavagem de dinheiro.

Tabela 1: Matriz de Confusão

 

O conceito de falso positivo ocorre quando um modelo estima que o indivíduo é uma anomalia (neste caso, ocorrência de suspeição de lavagem de dinheiro), e a condição verdadeira é que o mesmo não representa nenhum risco e, consequentemente, foi analisado erroneamente.

Já o conceito de falso negativo ocorre quando um modelo estima que o indivíduo não é uma anomalia (neste caso, descarta a suspeição de lavagem de dinheiro), e a condição verdadeira é que o mesmo representa risco de lavagem de dinheiro. Sendo assim, neste caso tal indivíduo foi descartado erroneamente.

Em estatística, chamamos estas situações de eventos de erro (tipo I e tipo II), e, para mitigá-los, usamos um mecanismo para trazer eficácia à decisão, conhecido como aplicação de um ponto de corte na distribuição. Basicamente ele tem a função de separar o conjunto de indivíduos de acordo com uma situação desejada. Um ponto de corte bem calibrado, tende a reduzir os eventos de erro.  A figura 1 ilustra as condições acima citadas.

 

Figura 1: ilustração de Falsos Positivos, Falsos Negativos e Ponto de Corte

 

Pela figura 1, nota-se que há eventos de risco representados pela cor vermelha e eventos de não risco representados pela cor verde. Nesta ilustração, a distribuição hipotética de eventos indica que quanto mais à direita, maior será a probabilidade de o indivíduo apresentar o risco de lavagem de dinheiro. Definido um ponto de corte (que particiona a distribuição de acordo com a sugestão do pesquisador), é possível avaliar quantos indivíduos estarão classificados corretamente e erroneamente em cada partição. Por suposição, se esperarmos que um ponto de corte seja perfeito e separe a distribuição entre indivíduos “bons” e “maus”, então todos os pontos em vermelhos deveriam estar à direita e os pontos em verde à esquerda dessa distribuição.

Estes conceitos são muito relevantes pois através deles é possível criar alguns indicadores de desempenho para os modelos existentes, bem como comparar com resultados de modelos desafiantes. Algumas das métricas mais conhecidas e mais utilizadas que podem ser extraídas da matriz de confusão, além da Taxa de Falsos Positivos (FPR) são: Acurácia, Recall, Precisão e F-Score. Maiores detalhes podem ser retirados de [1] e [2].

 

O próximo artigo da série trará algumas abordagens onde uso de analytics pode trazer mais eficiência para um programa de PLD-FT. 

 

[1] POLIZELI, M.; BUENO, L.F. Aplicação de algoritmos não supervisionados em dados eleitorais. 2019. Dissertação Mestrado - Universidade Federal de São Paulo / Instituto Tecnológico de Aeronáutica

[2] ZHU, X.; TAO, H.; WU, Z.; CAO, J.; KALISH, K.; KAYNE, J. Fraud Prevention in Online Digital Advertising. [S.l.: s.n.], 2017.

 

Autor

Mateus Vendramini Polizeli

Mestre em Engenharia de Produção e Pesquisa Operacional, com ênfase em Ciência de Dados pelo Instituto Tecnológico da Aeronáutica (ITA) e Universidade Federal de São Paulo (UNIFESP), Bacharel em Estatística pela Universidade Federal de São Carlos (UFSCar) com MBA em Gestão de Riscos pela Fundação Getúlio Vargas (FGV). Possui mais de 15 anos de experiência com modelagem de riscos, tendo trabalhado nos maiores bancos de varejo do país. Nos últimos três anos tem atuado na área de Analytics de Prevenção à Fraudes e Lavagem de Dinheiro em instituição financeira de grande porte.

e-mail para contato: mateus.polizeli@ipld.com.br