Escalando a Inteligência Artificial (AI) no Open Banking: Construindo a plataforma de aprendizado de máquina da Trustly

Engenheiro de aprendizado de máquina
”Tudo gira em torno dos dados!” Essa linha ficou comigo quando decidi me juntar à Trustly como seu primeiro engenheiro de aprendizado de máquina no início de 2023. É impressionante o que conquistamos em tão pouco tempo desde que começamos a criar nossa plataforma de aprendizado de máquina! O tempo entre o desenvolvimento do modelo e a implantação do modelo usado para a tomada de decisões na produção caiu de meses para cerca de uma semana.
Introduzimos a governança de modelos e várias salvaguardas antes e depois da implantação para reduzir o risco de erros de produção que afetam nosso tráfego e nossa lucratividade. Também diminuímos o tempo de resposta do modelo de segundos para apenas alguns milissegundos. Os marcos alcançados são tantos que fica difícil contar. Neste blog, descreverei como a Trustly se juntou à corrida para se tornar uma empresa importante em aprendizado de máquina e IA no espaço do Open Banking e por que estamos bem posicionados para vencê-la.
Pagamentos instantâneos garantidos dependem dos modelos de risco do Open Banking
Se os dados são o petróleo que alimenta a lucratividade a longo prazo, o Open Banking da América do Norte é um reservatório ainda a ser descoberto, enterrado nas profundezas de décadas de ineficiências e complexidades do sistema financeiro. Vamos nos concentrar em uma dessas ineficiências: trilhos de pagamento tradicionais, como o ACH. O ACH nos EUA leva dias para ser processado, e tem sido complicado e inconveniente para os clientes pagar com seus bancos devido à baixa experiência do usuário e aos longos prazos de liquidação. Por exemplo, você pode imaginar comprar ativos criptográficos e recebê-los dias depois? Esse foi o caso até a Trustly chegar ao mercado com Pagamentos Garantidos.
Agora, você pode entrar no seu banco, escolher de qual conta bancária deseja pagar e, com alguns cliques, seu pagamento será concluído. O comerciante recebe o pagamento e você recebe seus ativos digitais imediatamente. Qualquer cliente pode pagar imediatamente diretamente de sua conta, de qualquer banco, com o clique de um botão e sem precisar de um cartão de crédito ou inserir manualmente a conta e os números de roteamento. Além disso, a plataforma Open Banking da Trustly ajuda os comerciantes a reduzir taxas de processamento caras (a taxa média de processamento de cartão de crédito é de 2,24%, o que aumenta os custos de pagamento dos comerciantes).
Para que o pagamento ACH aconteça em tempo real, a Trustly paga o comerciante diretamente do próprio bolso no momento da transação e, posteriormente, coleta o pagamento da conta do cliente. Como você pode imaginar, a Trustly pode não conseguir cobrar o pagamento devido a fraude (que ainda é muito menor do que a fraude sem cartão presente, graças à autenticação multifatorial do banco) ou simplesmente porque o cliente não tinha fundos suficientes durante a transação. Alguns riscos, como os descritos acima, estão envolvidos no fornecimento dessa experiência de pagamento instantâneo, mas é aí que entra o aprendizado de máquina. O aprendizado de máquina reforça o mecanismo de risco Trustly para mitigar transações arriscadas e garantir que ainda possamos oferecer pagamentos garantidos com boa relação custo-benefício.
Conectores de pagamento construídos de forma confiável com a maioria dos bancos na América do Norte, cobrindo 99% das instituições financeiras entre o Canadá e os EUA. Essa tecnologia permite que a Trustly acesse e use novos dados do Open Banking para realizar análises de risco e decidir se aprova ou recusa uma transação. A capacidade da nossa plataforma está diretamente ligada ao sucesso de nossos modelos de risco. Embora os riscos sejam altos, a capacidade de acessar novos dados financeiros do consumidor nos dá uma vantagem competitiva para criar produtos de dados em grande escala usando o aprendizado de máquina.
A plataforma de aprendizado de máquina: tomada de decisão de alto risco em grande escala
Criamos nossa plataforma de aprendizado de máquina para apoiar a tomada de decisões para avaliação de risco transacional. Vamos falar sobre escala: Trustly conecta empresas a milhares de instituições financeiras nos EUA e no Canadá como um método de pagamento de conta para conta.
Um dos maiores desafios do Open Banking é a dificuldade de estabelecer um padrão único de dados entre todas as instituições financeiras. Cada instituição tem suas formas específicas de gerenciar e compartilhar seus dados. Trustly consolida os dados financeiros de todas as instituições financeiras e os categoriza em um único modelo de dados padrão. Nosso modelo de dados unificado nos permite criar um Feature Store que centraliza os dados de todas as instituições financeiras conectadas ao Trustly: os mesmos conjuntos de recursos podem, portanto, ser usados tanto para grandes bancos quanto para bancos locais. Esse alto nível de padronização nos permite escalar nossa operação de ML em instituições e regiões geográficas. Atualmente, temos mais de 1.700 recursos que podem ser reutilizados em todos os nossos modelos de aprendizado de máquina para melhorar a tomada de decisões.

Embora os recursos possam ser conectados e reproduzidos em qualquer modelo, geralmente precisamos dar atenção específica aos principais parceiros comerciais ou instituições financeiras. Por exemplo, uma grande instituição financeira nos EUA pode exigir um modelo específico, enquanto instituições menores com comportamento semelhante podem ser agrupadas em um único modelo. Trustly atualmente opera vários modelos individuais de aprendizado de máquina. junto com outros modelos que desafiam os que estão em produção para garantir um ciclo de feedback contínuo. Continuamos nos esforçando para melhorar nosso desempenho.
Embora na maioria dos setores, as equipes de ciência de dados geralmente operem como artesãos, onde cada desenvolvimento de modelo tem um cientista de dados dedicado e seu próprio código, o Trustly exige uma abordagem mais industrial. Como parte de nossa plataforma, criamos um pipeline de modelos padronizado que abrange todos os aspectos da criação, implantação e observabilidade do modelo, incluindo preparação de dados, seleção de recursos, ajuste de hiperparâmetros, regularização, validação de recursos, orquestração, rastreamento de artefatos e empacotamento de terminais de serviços. Esse pipeline é versionado em uma biblioteca interna. Ele é orientado por configurações e é baseado em etapas configuráveis.
Por exemplo, é obrigatório aplicar o ajuste de hiperparâmetros para o desenvolvimento do modelo, mas é possível escolher diferentes algoritmos de ajuste por meio de uma configuração declarativa. Por meio desse esforço, conseguimos reduzir o tempo de desenvolvimento do modelo de cerca de 3 meses para uma única semana. Conseguimos atualizar todos os nossos modelos por meio de reciclagem automatizada, graças à implementação dessa padronização.
Por último, mas não menos importante, nossos modelos mais solicitados operam e mantêm um desempenho robusto de solicitação por segundo (RPS) em condições comerciais regulares e podem demonstrar um aumento significativo da capacidade durante grandes eventos, como o Super Bowl. Além disso, como operamos em um negócio transacional, a avaliação de risco deve responder a fortes restrições de tempo. Nenhum cliente esperará segundos para que seu pedido seja processado. À medida que introduzimos avanços metodológicos na seleção de recursos, regularização e processamento paralelo, reduzimos em até 10 vezes os tempos de resposta e temos todos os nossos novos modelos com latência de p99 abaixo de 200 ms, com alguns modelos realmente respondendo abaixo de 35 ms!
Além da escalabilidade, também precisamos lembrar que oferecemos uma garantia e atendemos empresas em setores de alto risco, como criptomoedas e apostas, com um impacto direto em nosso P&L se algo der errado com a avaliação de risco. Se nossa plataforma de aprendizado de máquina cair, teremos sérios problemas! Para evitar esse risco, desenvolvemos fortes medidas e processos de controle: cada mudança nos modelos e políticas segue procedimentos rígidos de governança, como revisão por pares, cartões de modelo, testes automatizados, verificações de cobertura de testes, testes de estresse e várias outras formas de validação. Além disso, temos salvaguardas implementadas para reduzir o raio de explosão e a gravidade de possíveis incidentes. Por exemplo, cada modelo é acompanhado por pelo menos um modelo alternativo que pode ser ativado se o principal ficar indisponível. O modelo alternativo pode atuar como um substituto se um grupo de recursos não for calculado ou se o endpoint do modelo começar a atingir o tempo limite, permitindo que continuemos as operações sem tempo de inatividade em caso de falhas.
Escalando a IA no Open Banking
Somos uma equipe pequena e jovem de Engenharia de Aprendizado de Máquina e Cientistas de Dados. Ainda há muito trabalho fundamental a ser feito. Pode não ser hoje, amanhã ou no próximo ano, mas estamos confiantes de que nosso trabalho preparará o terreno para uma IA de classe mundial em Open Banking. Trustly abriu a superfície e cavou tão fundo que atingiu o grande reservatório do sistema financeiro norte-americano que são os dados do Open Banking juntamente com o aprendizado de máquina. Os dados estão aumentando. É hora de continuar construindo nossa plataforma de aprendizado de máquina para alimentar novos aplicativos do Open Banking.
Fique por dentro
Obtenha informações e atualizações exclusivas sobre tudo o que diz respeito ao Open Banking e aos Pagamentos.