Consumenten en bedrijven verliezen wereldwijd miljarden dollars per jaar door de meedogenloze aanvallen van cybercriminelen. Financiële instellingen spenderen nog eens miljarden aan het onderzoeken en terughalen van het gestolen geld. Aangezien de aanvallen steeds geraffineerder worden, moeten geldverwerkers sterke fraudepreventie mechanismen in hun strategieën opnemen om hun klanten en zichzelf te beschermen tegen onnodige kosten. Door de alsmaar groeiende hoeveelheid gegevens die financiële instellingen vastleggen, is anomalie detectie een hulpmiddel van onschatbare waarde voor het identificeren van frauduleuze transacties en frauduleus gedrag. In artikel leggen we verder uit wat anomalie detectie in finance inhoudt. MotivatieAnomaliedetectie verwijst doorgaans naar het proces van het identificeren van uitschieters in een gegevensreeks die grotendeels uit “normale” gegevenspunten bestaat. Het idee is om gegevens te vinden die zijn gegenereerd door een ander proces dan de meerderheid van de gegevens. In veel gevallen komt dit overeen met het vinden van gegevens die foutief of door frauduleuze activiteiten zijn gecreëerd. Een type gegevens waarbij anomalieën van bijzonder groot belang worden geacht, zijn financiële transacties. Transactie Registraties leggen de stroom van activa tussen partijen vast, die, wanneer zij over langere perioden worden geobserveerd, bepaalde patronen volgt. Frauduleuze activiteiten wijken vaak op de een of andere manier af van deze patronen, wat een aanknopingspunt biedt voor datagestuurde methoden om fraude op te sporen. Regelgebaseerde benaderingen vs. Machine LearningEen manier om dit probleem aan te pakken zou kunnen zijn om een aantal hard-coded criteria voor ‘normale’ transacties op te stellen die gebaseerd zijn op domeinkennis. We kunnen bijvoorbeeld weten dat transacties van rekening x op dag y gewoonlijk een bepaald bedrag niet overschrijden; alle transacties die niet aan deze voorwaarde voldoen, kunnen dus als anomalieën worden aangemerkt. Het nadeel van dit soort aanpak is dat we van tevoren moeten weten hoe een uitbijter eruit gaat zien. In de meeste gevallen is het niet haalbaar, zelfs niet voor domeinexperts, om te anticiperen op alle vormen die een anomalie zou kunnen aannemen, aangezien de ruimte van mogelijke criteria te groot is om manueel te doorzoeken. Gelukkig is dit een probleem waarbij machinaal leren ons kan helpen. In plaats van bepaalde criteria te moeten definiëren voor de detectie van uitbijters, kunnen we een model bouwen dat deze criteria leert (zij het minder expliciet) door te trainen op grote hoeveelheden gegevens. In dit artikel gaan we zo’n model toepassen, namelijk een Isolation Forest, en we zullen een extra verklarend model gebruiken dat ons gaat helpen om de beslissingen die ons anomalie detectie model neemt te begrijpen. Meer info? Tuuring.com |
https://tuuring.com/ |