I Big Data a servizio del Fraud Management assicurativo

I Big Data a servizio del Fraud
Management assicurativo:
un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
ll Centro di Ricerca in Tecnologie, Innovazione e Servizi Finanziari (CeTIF) dal 1990 realizza
studi e promuove ricerche sulle dinamiche di cambiamento strategico e organizzativo nei settori
finanziario, bancario e assicurativo.
Ogni anno CeTIF attiva più di 15 Competence Centre e Osservatori, cui possono partecipare gli
oltre 10.000 professionisti che costituiscono il suo network e organizza oltre 10 workshop dedicati a
banche e assicurazioni, con l’obiettivo di favorire fra i partecipanti lo scambio di esperienze su temi
specifici e sull’adozione di pratiche innovative.
A tutto ciò si aggiungono i progetti di ricerca internazionali realizzati in collaborazione con le
principali università e società di analisi e di ricerca presenti nel mercato. Le attività si focalizzano
principalmente sugli effetti dello sviluppo di nuove strategie, sull’innovazione normativa,
sull’approfondimento di prassi organizzative e di processo e sugli effetti dell’introduzione
dell’innovazione tecnologica.
Tra i partner istituzionali di CeTIF figurano: Banca d’Italia, ISVAP, ABI, ANBP, ANIA, AIPB e
CONSOB.
Dal 2011 in seno a CeTIF è stato costituito il CEFIRS - Centre for European Financial Regulations
Studies - un Osservatorio Permanente sulla regolamentazione nel settore finanziario, bancario e
assicurativo.
Il CeTIF è, inoltre, socio fondatore del FIT: l’Associazione europea dei centri di ricerca sulla finanza
e l’Information Technology.
Per ulteriori informazioni www.cetif.it
GFT Italia è parte del Gruppo GFT Technologies AG, basato in Germania e provider mondiale di
soluzioni IT per il settore finanziario, bancario e assicurativo presente in Spagna, Regno Unito,
Francia, Svizzera, Brasile e Stati Uniti.
GFT Italia si avvale di oltre 500 addetti presso le sedi di Milano, Firenze, Siena, Torino, Parma,
Piacenza, Padova, Genova e Palermo e vanta un portafoglio di offerta che comprende Business &
IT Consulting, Digital Marketing & Communication, IT Solution&Services e Managed Services.
GFT Italia collabora con i propri clienti condividendo esigenze, processi decisionali e opportunità di
business coniugando le solide esperienze e la profonda conoscenza dei diversi settori di mercato
con le competenze specialistiche di Program Management & Consulting, System Integration e
Service Management
Per ulteriori informazioni www.gft.com/it
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 2/18
Contenuto
1
1.1
2
2.1
3
3.1
4
4.1
5
5.1
Le frodi assicurative: lo scenario italiano ed europeo ............................................................ 4
Le frodi assicurative: lo scenario italiano ed europeo ................................................................ 4
Compagnie assicurative e lotta alle frodi: modelli organizzativi ............................................ 7
Compagnie assicurative e lotta alle frodi: modelli organizzativi ................................................. 7
Il valore delle informazioni: i Big Data ....................................................................................... 9
Il valore delle informazioni: i Big Data ........................................................................................ 9
I Big Data a servizio del fraud management assicurativo .....................................................11
I Big Data a servizio del fraud management assicurativo ........................................................11
Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT ...............13
Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT .....................13
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 3/18
1
Le frodi assicurative: lo scenario italiano ed europeo
1.1
Le frodi assicurative: lo scenario italiano ed europeo
La peculiarità dei fenomeni fraudolenti che connotano il sistema assicurativo italiano è
1
immediatamente deducibile analizzando la definizione che alcune compagnie nazionali hanno
identificato come appropriata per definire il fenomeno fraudolento nel nostro Paese: la frode è
identificabile con quei fenomeni del ramo danni riconducibili a reato, che affliggono principalmente il
ramo Auto, ma anche rami differenti da quello RC (quali il ramo danni elementari e quello infortuni)
seppure in misura meno marcata. Se nella definizione possono certamente essere fatti rientrare la
falsa certificazione, la simulazione del fatto e il falso ideologico, da essa devono invece essere
esclusi tutti i fenomeni speculativi, quali la sovrastima del danno a cose o persone; questo perché in
uno scenario quale quello italiano, nel quale è diffusa la tendenza a ritoccare all’insù i danni
riscontrati nel verificarsi di un evento sinistroso, una definizione estensiva del fenomeno finirebbe
per far rientrare nel perimetro delle frodi assicurative una grande maggioranza dei sinistri denunciati
alle compagnie.
Il sistema Italia è contraddistinto inoltre da una tendenza a non identificare la frode alle
assicurazioni come un evento criminoso, ma come un atto di furbizia o di astuzia; la maggior parte
degli assicurati è convinta che l’assicurazione «guadagni troppo alle loro spalle» e dunque la frode,
poiché idealmente condotta contro l’assicurazione stessa, è quasi percepita come uno strumento
per veder saldato il credito che l’assicurato ritiene di vantare nei confronti della compagnia.
Tuttavia, la realtà dei fatti è ben differente: manca la consapevolezza del fatto che il numero e
l’entità dei danni da risarcire, indipendentemente dal fatto che siano questi reali o fraudolenti, incide
direttamente sui premi che ciascun assicurato dovrà corrispondere nel futuro.
Le frodi inducono un elevato spreco di risorse che a sua volta determina un aumento nell’importo
dei premi assicurativi richiesti alla clientela; il circolo vizioso innescato si ripercuote sul
consumatore finale, che si ritrova a dover pagare un prezzo superiore per l’elevato costo di
gestione dei sinistri sopportato dalle compagnie. Date queste premesse, si evince che le frodi
rappresentano un fenomeno che necessita di essere gestito in modo ottimale al fine di contenerne
gli impatti negativi sul sistema nel suo complesso.
Con riferimento al nostro Paese, negli ultimi anni si è assistito ad una contrazione nella raccolta del
ramo danni, dovuta principalmente ad una diminuzione del ramo RC Auto. La riduzione dei premi
raccolti è andata di pari passo con la diminuzione dei sinistri accaduti e denunciati e che hanno
dato o daranno luogo a un risarcimento; infatti, il numero totale degli incidenti nel 2012 è stato pari
a 2,3 milioni, con una diminuzione del 15,3% rispetto al 2011 .
Inoltre, i risultati negativi del ramo si accompagnano ad una particolare esposizione dello stesso al
rischio frodi. Analizzando i dati IVASS relativi al 2011, i sinistri riconducibili a fenomeni fraudolenti a
danno delle imprese assicurative sono stati 54.502, con un’incidenza del 2,04% sulla globalità
dei sinistri del ramo RC Auto. Si registra un importo totale di 281,9 milioni di Euro, pari al 2,42%
dell’ammontare complessivo dei risarcimenti e all’1,59% dei premi del ramo.
È opinione comune che queste statistiche probabilmente non riflettano la reale portata del
fenomeno italiano, non riportando alcuna traccia delle frodi sommerse, cioè quelle attuate, ma non
accertate dal sistema assicurativo. Tale stato delle cose trova conferma nel momento in cui si
procede a confrontare il fenomeno delle frodi italiano con quello europeo; in Europa la media dei
1
Definizione condivisa dal gruppo di lavoro partecipante al Competence Centre CeTIF 2013, dal titolo “Fraud Management
assicurativo 2013: processi e sistemi alla luce della nuova normativa”, svoltosi nel periodo marzo-maggio 2013 con la
partecipazione di 12 compagnie e gruppi assicurativi operanti nel mercato italiano.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 4/18
sinistri fraudolenti nel ramo RC Auto si attesta infatti intorno al 10%, contro il poco
realistico 2,3% in Italia (Figura 1).
Figura 1 - I fenomeni fraudolenti in Italia e in Europa
Fonte: rielaborazione CeTIF di dati IVASS 2011
La rilevanza del fenomeno e i significativi effetti negativi che le frodi possono generare sul sistema
assicurativo italiano hanno indotto l’autorità ad affidare ad IVASS - Istituto per la Vigilanza sulle
Assicurazioni l’incarico di organismo nazionale unico atto alla prevenzione delle frodi nel
settore dell’assicurazione e della responsabilità civile derivante dalla circolazione dei veicoli a
motore.
Sebbene nel contesto europeo si siano fatte in alcuni casi scelte differenti - affidando l’attività
antifrode a enti privati senza scopo di lucro (a titolo esemplificativo, in Francia con Alfa e Agira e nel
Regno Unito con CIFAS - Credit Industry Fraud Avoidance System) o a più autorità distinte
contemporaneamente, ciascuna con un proprio ambito di operatività - appare in ogni caso evidente
che in tutti i paesi dell’Unione il problema è ben noto e sono state poste in essere azioni molteplici
per tentare di affrontarlo ed arginarlo nel più efficace dei modi.
In generale, trattandosi di un fenomeno che ha impatti sul sistema assicurativo nel suo complesso,
è opportuno sottolineare come nessuno dei suoi attori possa essere escluso dal porre in essere
azioni finalizzate alla prevenzione, all’individuazione e alla lotta alle frodi. Le azioni correttive sono
dunque attese sia da parte della o delle autorità incaricate dell’azione antifrode, sia da parte del
legislatore, oltre che ovviamente anche da parte delle compagnie assicurative stesse.
In Italia dovranno pertanto rendersi operativi:


IVASS, l’autorità, che deve strutturarsi al fine di svolgere il proprio ruolo all’interno del sistema
assicurativo italiano come principale organismo antifrode nel modo più efficace ed efficiente
possibile;
il legislatore, che deve intervenire con provvedimenti che prendano in considerazione il trade
off tra tutela del cliente e possibilità di contrastare opportunamente i fenomeni
fraudolenti;
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 5/18

le compagnie assicuative, che si devono strutturare sia dal punto di vista organizzativo sia da
quello tecnologico al fine di prevenire, individuare e contrastare il maggior numero di frodi
possibili.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 6/18
2
Compagnie assicurative e lotta alle frodi: modelli organizzativi
2.1
Compagnie assicurative e lotta alle frodi: modelli organizzativi
Prevenire e contrastare i fenomeni fraudolenti all’interno del contesto assicurativo implica notevoli
sforzi da parte delle compagnie le quali hanno dovuto investire significativamente in tre aree
essenziali per l’efficace funzionamento di un sistema di fraud management:



modelli organizzativi
modelli operativi
sistemi informativi.
Infatti, la natura multiforme dei fenomeni fraudolenti e le difficoltà intrinseche alla loro prevenzione
ed individuazione inducono le compagnie a porre in essere profondi cambiamenti sia a livello
operativo-organizzativo sia a livello di dotazioni informatiche delle quali le aziende sono dotate.
In particolare, le persone e la loro organizzazione sono fondamentali ai fini dell’istituzione di un
efficace sistema di fraud management poiché le risorse umane rappresentano l’elemento in grado
di rendere effettivamente e correttamente operative le linee guida e le disposizioni che la
compagnia ha previsto per la lotta alle frodi. È inoltre opinione comune che anche il più sofisticato
dei sistemi di fraud management non potrà mai sostituire integralmente la componente umana che
caratterizza i processi di gestione delle frodi. Le procedure manuali rappresentano dunque un
necessario complemento all’operatività del sistema informativo, soprattutto nelle fasi di detection e
2
di investigation , oltre che nell’identificazione delle frodi interne, perpetrate all’interno della
compagnia stessa, spesso con il coinvolgimento diretto di suoi fiduciari. Tali tipi di attività,
scarsamente standardizzabili e connotate da elevata variabilità, possono essere gestite in modo
ottimale soltanto dagli operatori dedicati alle attività antifrode. La componente “umana” è essenziale
per una corretta comprensione e qualificazione del fenomeno di frode, per la gestione delle
eccezioni, oltre che per configurare ed alimentare correttamente le tecnologie adottate dalle
imprese assicurative.
Le compagnie sono tutte dotate di strutture organizzative ad hoc (unità antifrode aziendale)
dedicate all’individuazione delle linee guida per lo svolgimento dell’attività antifrode e alla loro
implementazione all’interno dell’azienda. Ciascuna impresa assicurativa ha adottato un sistema
organizzativo diverso a seconda delle proprie peculiarità e della propria cultura aziendale, ma sono
evidenziabili alcune caratteristiche che il comparto assicurativo italiano tende a riconoscere come
necessarie per identificare un modello di fraud management adeguato.
Innanzitutto, è essenziale il presidio da parte dell’unità antifrode dell’intero ciclo di gestione
della polizza e del sinistro; in questo senso, il fatto che l’unità antifrode abbia una visione
complessiva di tutte le fasi del processo rappresenta un fattore critico di successo in grado di
attuare un migliore contrasto alle frodi. Soltanto se si conosce la totalità del processo e se lo si
2



Il processo di gestione della frode si articola in tre fasi fondamentali:
Fase di Prevention: insieme delle attività finalizzate a prevenire il verificarsi di fenomeni fraudolenti e/o l’assunzione del
rischio di frode da parte della compagnia (ossia prima che essi si traducano in un fenomeno concreto che necessiti di essere
gestito da parte dell’impresa);
Fase di Detection: operazioni volte ad individuare i casi di sospetta frode che debbano essere segnalati all’unità antifrode
per lo svolgimento delle attività di investigazione, riducendo l’incidenza dei casi di “falsi positivi” segnalati all’unità
antifrode;
Fase di Investigation: attività di analisi dei casi segnalati come possibili frodi al fine di verificarne l’effettiva natura
fraudolenta
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 7/18
monitora integralmente si sarà in grado di individuare con maggiore abilità gli ambiti e le attività più
critiche e che possono quindi più facilmente dare adito a tentativi di frode.
Inoltre, di primaria rilevanza risulta essere l’attività svolta dai fiduciari e, in particolare, il ruolo
giocato dal liquidatore nell’individuazione di possibili frodi nel corso del processo di liquidazione.
Il liquidatore ha la visione complessiva del processo di gestione del sinistro ed è quindi in una
condizione favorevole al fine di individuare i sinistri sospetti e di procedere con la segnalazione
all’unità antifrode preposta; il suo grado di competenza in merito alla capacità di riconoscere se un
evento sinistroso ha caratteristiche tali da dover essere effettivamente gestito dall’unità antifrode o
se si tratta invece di un “falso positivo” (ossia un sinistro che appare fraudolento ma che in realtà
non lo è) è essenziale per garantire l’ottimale operatività dell’unità. È necessario però sottolineare
come ad ostacolare l’efficacia dell’azione antifrode dei liquidatori si ponga spesso il sovraccarico di
attività a cui essi sono sottoposti; le azioni antifrode che gli si richiede di porre in essere vanno a
sommarsi alla molteplicità dei task che devono compiere abitualmente nel corso del processo di
liquidazione, generando carichi di lavoro che sono spesso di difficile gestione. La complessità e la
mole di attività inducono spesso i liquidatori a svolgere controlli limitati in ambito antifrode con una
conseguente minore efficacia del fraud management aziendale.
Estendendo l’analisi a tutti i fiduciari, si evince che la principale criticità riscontrata con riferimento
al loro ruolo di lotta ai fenomeni fraudolenti è riconducibile alla costituzione di un ecosistema
compagnie-fiduciari-agenti nel quale si dovrebbero realizzare costanti scambi e condivisioni delle
informazioni relative ai sinistri e alle frodi sospette, così da garantire un continuo aggiornamento
sulle attività antifrode in corso di svolgimento. I processi di comunicazione fra questi attori del
sistema assicurativo spesso non vengono svolti oppure risultano essere poco tempestivi e connotati
da elevata imprecisione nelle informazioni circolarizzate, con grave nocumento della qualità del
processo antifrode. I fiduciari risultano essere generalmente scarsamente predisposti alla
collaborazione con gli altri attori del sistema, ragione per la quale molte compagnie hanno istituito
dei sistemi di incentivazione, rivolti in particolare ai medici, al fine di sensibilizzarli e incoraggiarli a
contribuire fattivamente al contrasto e alla prevenzione dei fenomeni fraudolenti.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 8/18
3
Il valore delle informazioni: i Big Data
3.1
Il valore delle informazioni: i Big Data
La penetrazione capillare della tecnologia nella nostra società, la diffusione dei social media e
l’inarrestabile evoluzione dei sistemi informatici genera un’ingente ed estremamente variegata
quantità di informazioni. Nell’ultimo decennio si è assistito alla rapida diffusione di nuove «sorgenti
di informazione», quali i Social Media e i Social Network, i dispositivi mobile, reti di sensori e
strumenti scientifici sempre più sofisticati. Da questi fenomeni innovativi è possibile ricavare
grandissimi volumi di dati, non necessariamente strutturati, la cui validità è spesso legata al
momento in cui vengono generati.
Le informazioni costituiscono una necessità fondamentale, essendo alla base di qualsiasi processo
decisionale; tuttavia il solo fatto che le informazioni esistano non è di per sé sufficiente a costituire
un effettivo valore. Sono necessarie almeno 2 condizioni affinché questa moltitudine di dati si
trasformi in “patrimonio informativo”:


Completezza: le informazioni devono avere un grado di dettaglio elevato e devono provenire
da molteplici fonti per poter valutare un elemento da diversi punti di vista;
Tempestività: il valore di un’informazione è direttamente proporzionale alla sua “freschezza”,
soprattutto in un contesto come quello attuale dove la velocità di generazione delle
informazioni è estremamente elevata; se ne desume che è fondamentale che le informazioni
raccolte possano essere consultate rapidamente.
Vi è poi un ulteriore aspetto che deve essere considerato: il valore informativo di un insieme di dati
non è costituito solo dalla somma delle informazioni di ogni singolo dato ma anche e soprattutto
dalle relazioni che sussistono tra i dati stessi. Le relazioni tra i dati danno vita a nuove
informazioni, potenzialmente in un numero più elevato rispetto ai dati di partenza; tali nessi
costituiscono un notevole valore aggiunto “nascosto” a cui però non è facile accedere con i sistemi
tradizionali (transazionali).
L’accesso alle informazioni secondo le modalità descritte è una necessità pressante per le tutte le
aziende, in particolare per quelle che operano nel settore dei servizi, dove il sempre più elevato
livello di competitività del mercato richiede la capacità di effettuare valutazioni complesse in tempi
rapidi per intervenire tempestivamente sui fenomeni problematici. Tutte le aziende di dimensioni
medio - grandi dispongono di grandi database in cui sono contenute moltitudini di informazioni
relative al proprio business. Queste strutture informative, però, pur essendo estremamente ricche di
dati, sono poco flessibili e comportano alcuni limiti, non sempre facilmente risolvibili:




Mancanza di comunicazione: sono quasi sempre strutture dipartimentali e costituite da
sistemi “monolitici” non in comunicazione tra loro. La diretta conseguenza di questa struttura si
sostanzia nel fatto che ogni singola interrogazione non è esaustiva; la mancanza di
comunicazione tra le varie basi dati dipartimentali rende necessario fare più interrogazioni per
ottenere le informazioni necessarie da tutte le basi dati (a meno di replicare le informazioni
nelle varie basi dati);
Analisi delle relazioni: con i sistemi tradizionali è estremamente complesso quando non
impossibile analizzare le relazioni che sussistono fra dati distinti;
Estendibilità della base dati: includere nuove fonti in una base dati “tradizionale” è
un’operazione complessa con ricadute non trascurabili sul fronte dei tempi e dei costi;
Accesso a fonti esterne all’azienda: solitamente sono presenti solamente i dati provenienti
dall’ambito aziendale, mentre i dati provenienti da fonti esterne richiedono operazioni di
normalizzazione, più o meno onerose.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 9/18
In altri termini: il problema di oggi non è il reperire l’informazione ma la capacità di gestirla,
analizzarla, sintetizzarla e di estrarne il «valore aggiunto» in modo efficiente e scalabile.
I gruppi di informazioni la cui mole e complessità sono tali da rendere necessari nuovi approcci,
architetture e tecnologie che ci consentano di gestirli, sono definiti “Big Data”.
L’enorme volume di questi dataset, la loro eterogeneità e quella delle fonti da cui provengono, il
bisogno di poter effettuare le analisi in tempi brevissimi per evitare che il valore informativi del dato
si deteriori a causa dell’obsolescenza e, soprattutto, la necessità estrarre il «valore aggiunto» in
esse nascosto in termini di relazioni tra i dati, mettono in campo scenari la cui complessità genera
una crisi dei sistemi tradizionali.
Comunemente, i sistemi basati su un approccio “Big Data” vengono descritti mediante la definizione
delle “3 V”, che permette di individuare facilmente alcuni degli elementi caratterizzanti di questa
tecnologia:



Volume: i sistemi basati sulla tecnologia Big Data sono in grado di acquisire, memorizzare e
consultare enormi quantità di dati che comporterebbero significative difficoltà se approcciate
mediante le tecnologie tradizionali;
Variety: questa è forse una delle possibilità più interessanti dei sistemi Big Data, ossia la
capacità di acquisire dati da molte fonti eterogenee e senza la necessità che gli stessi siano
organizzati secondo una struttura predefinita. I sistemi Big Data possono acquisire dati
strutturati, semi-strutturati o non strutturati (raw data) provenienti da molte fonti diverse e la
base dati può essere estesa con nuove fonti in tempi ridotti rispetto ai sistemi RBDMS;
Velocity: l’abilità dei sistemi Big Data di poter acquisire dati senza la necessità di memorizzarli
secondo un formato predefinito, permette di consultare i dati acquisiti dopo breve tempo
dall’acquisizione, riducendo sensibilmente il rischio di obsolescenza degli stessi.
Questa definizione risulta essere riduttiva, perché non include una delle caratteristiche più
interessanti e maggiormente differenzianti dei Big Data, ossia la capacità di individuare ed
analizzare le relazioni nascoste tra i dati. Se il valore informativo di un dataset è superiore alla
somma delle informazioni legate ai singoli dati, grazie alle relazioni esistenti fra essi, spesso queste
relazioni sono “nascoste” in quanto non sono indagabili con un sistema informativo tradizionale.
I sistemi Big Data, invece, sono in grado di individuare queste relazioni in maniera nativa. Questa
possibilità aumenta in maniera sensibile il valore del proprio patrimonio informativo permettendo di
fare analisi sul tipo e la quantità di relazioni che interconnettono i dati; in questo modo è anche
possibile individuare le relazioni tra elementi provenienti da fonti diverse. L’approccio Big Data
permette non solo di utilizzare una mole più grande di dati e una varietà più ampia di fonti,
indipendentemente dalla struttura che esse hanno, ma soprattutto di “estrarre” molte più
informazioni dai dati sfruttandoli in maniera più completa ed efficace.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 10/18
4
I Big Data a servizio del fraud management assicurativo
4.1
I Big Data a servizio del fraud management assicurativo
Se le azioni organizzative e di processo che le compagnie assicurative hanno intrapreso per
migliorare la propria capacità di prevenire e contrastare le frodi rappresentano un elemento
essenziale della strategia di fraud management delle imprese, un approccio efficace per la gestione
di tali fenomeni non può però prescindere dall’adozione di strumenti informativi idonei a contrastare
in maniera efficace il rischio di frode. Inoltre deve essere tenuto in debito conto il sempre più
incisivo fenomeno delle frodi organizzate che, sebbene numericamente inferiori rispetto alle frodi
occasionali (anche definite “opportunistiche), generano un aggravio economico maggiore per le
compagnie; inoltre, essendo organizzate da “professionisti della frode” (spesso dalla stessa
criminalità organizzata) è estremamente complesso rilevarle, perché vengono prese tutte le
contromisure atte a impedire che la frode venga scoperta. I frodatori stessi evolvono le loro tecniche
di azione per evitare di venire individuati dalle regole dei motori antifrode e le frodi diventano
sempre più complesse e articolate, uscendo dai soli contesti locali per andare a radicarsi nell’intero
territorio nazionale, rendendo sempre più complesso il lavoro delle unità antifrode.
Gli strumenti tecnologici aiutano a superare le difficoltà operative della struttura di controllo adibita
alle funzioni di individuazione e gestione delle frodi, facilitando l’analisi di quantità di dati massive
per individuare eventuali fenomeni “occulti” e potenziali schemi di frode. Per tale ragione, è proprio
l’area dei sistemi informativi quella nella quale le imprese di assicurazione desiderano investire con
maggior urgenza al fine di migliorare l’efficienza e l’efficacia dei processi di fraud management.
Tuttavia, la mancanza o l’incompletezza dei dati relativi ai soggetti frodatori e ai sinistri
denunciati rendono complicato il monitoraggio delle situazioni potenzialmente rischiose e riducono
significativamente la possibilità di dedurre con sufficiente anticipo l’esistenza di schemi fraudolenti
ricorrenti, minando alla base l’efficacia di qualsiasi tecnologia di fraud management. Allo stesso
tempo, risultano essere spesso assenti anche adeguati sistemi integrati di reportistica e tracciatura
dei rapporti in essere con i propri contraenti. È dunque evidente quanto sia rilevante disporre di una
base di dati completa relativa ai sinistri della compagnia, dalla quale dedurre i comportamenti
fraudolenti sulla base di schemi e modelli efficaci nell’individuare le frodi potenziali con lo scopo di
gestirle nella maniera opportuna.
I dati storici relativi ai sinistri denunciati presso la compagnia potrebbero essere integrati anche
dall’utilizzo di informazioni raccolte presso soggetti terzi (ad esempio, altre compagnie
assicurative, del medesimo gruppo o di gruppo differente), al fine di migliorare la quantità dei dati a
disposizione e incrementare dunque la possibilità di individuare con successo possibili schemi di
frode. Tuttavia, tali logiche di scambio massivo di informazioni risultano essere in contrasto con le
previsioni normative attuali ed inoltre richiederebbero un livello di maturità delle dotazioni
tecnologiche finalizzate alla gestione dei fenomeni fraudolenti superiore rispetto a quello
attualmente riscontrabile nel settore. Lo scambio di informazioni tra compagnie e soggetti terzi potrà
probabilmente rappresentare un successivo step nel percorso di adattamento dei supporti
informatici delle compagnie alle esigenze di fraud management.
Inoltre, i dati detenuti presso i database delle compagnie potrebbero essere integrati con le
informazioni presenti nelle banche dati istituzionali (IVASS, ANIA, Casellario Centrale Infortuni
INAIL, ecc.) e non istituzionali presenti nel panorama italiano al fine di rendere maggiormente
esaustivo il data set utilizzato per l’individuazione delle frodi. Con riferimento alle banche dati non
istituzionali, oltre ai dati delle black-box eventualmente installate dai clienti e alle informazioni di
geolocalizzazione - ricavabili dai sistemi antifurto satellitari, dalle telecamere per il controllo della
velocità e dai dispositivi telepass - un ambito di particolare interesse è quello del flusso quotidiano
di input proveniente dai social media. Sebbene l’incertezza normativa e le regole di visibilità
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 11/18
pubblica dei dati non permettano attualmente di utilizzare in maniera puntuale queste informazioni
per verificare l’esistenza di potenziali fenomeni fraudolenti, i social media rappresentano un canale
di raccolta di informazioni di rilevanza crescente e che sta suscitando l’attenzione anche delle
compagnie assicurative del nostro paese.
È tuttavia opportuno specificare che la presenza di database ricchi di dati completi, aggiornati e
provenienti da fonti plurime potrebbe non garantire di per sé un efficace funzionamento del sistema
di gestione delle frodi. Se è vero che le informazioni rappresentano l’unità fondamentale di un
sistema di fraud management ottimale, i “Big Data” rappresentano un patrimonio di
grandissimo valore per l’azienda che li detiene, ma sono al contempo una ricchezza connotata da
una particolare complessità di immagazzinamento, gestione ed elaborazione.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 12/18
5
Migliorare le regole antifrode tramite le tecnologie BIG DATA: la
proposta GFT
5.1
Migliorare le regole antifrode tramite le tecnologie BIG DATA: la
proposta GFT
I sistemi antifrode tradizionali sono quasi sempre basati su un set di regole, più o meno sofisticate,
che permettono di valutare il rischio di frode di un singolo sinistro sulla base di alcuni parametri (ad
esempio, il numero di sinistri precedenti dell’assicurato, la dinamica anomala di un sinistro, la
prossimità alla scedenza di una polizza, ecc.). Tali sistemi hanno dimostrato una discreta efficacia
nell’individuare alcune delle tipologie più comuni di frode opportunistica, tuttavia non sono in grado o hanno capacità molto limitate - di individuare gli schemi complessi propri delle frodi organizzate,
proprio perché la valutazione viene effettuata sulla base degli elementi legati ai sinistri in corso di
analisi. Con questi sistemi, basati sulla sola valutazione delle regole, si riesce a “coprire” molte aree
di indagine relative alle frodi perpetrate, ma risulta molto complicato includere nei parametri di
indagine elementi relativi a eventuali relazioni indirette con altri sinistri (ad esempio, se un soggetto
ha ricoperto il ruolo di testimone in più sinistri, se gli stessi soggetti sono stati coinvolti in più sinistri
magari con ruoli diversi, se lo stesso schema di frode si sta ripetendo in regioni diverse).
L’elemento distintivo delle frodi organizzate è però proprio la rete di relazioni “nascoste”che
sussiste tra i soggetti che reiterano le frodi; l’individuazione tempestiva di queste relazioni e dei
soggetti che vi partecipano permette di ottenere il duplice risultato di intercettare la frode prima
della fase di liquidazione e di prendere le necessarie contromisure nei confronti dei soggetti
che partecipano all’organizzazione, evitando il ripetersi del fenomeno illecito da parte degli
stessi. Inoltre, i sistemi tradizionali sono spesso basati su database transazionali che sono
estremamente validi per individuare le modificazioni di un’informazione nel corso del tempo (ad
esempio, le variazioni della documentazione allegata alla denuncia, le modifiche al contratto, ecc.)
ma quasi sempre accedono alle informazioni di un numero estremamente limitato di sistemi (ad
esempio, sistema sinistri, sistema di portafoglio, ecc.); questo accade perché estendere la base dati
interrogata è un processo piuttosto complesso e oneroso. Una soluzione basata su un approccio di
tipo Big Data permetterebbe di implementare una base dati dedicata al sistema antifrode, con un
numero maggiore di dati provenienti da molte fonti eterogenee ed in particolare da fonti esterne alla
compagnia; sebbene tali informazioni siano accessibili alle compagnie anche oggi, esse non sono
integrate nei sistemi attuali, richiedendo quindi all’operatore distinte interrogazioni su sistemi
differenti.
Tanto più è ingente la quantità di dati a disposizione, quanto più risulta essere fondamentale la
qualità dello strumento informativo adottato per leggere, interpretare e comunicare le evidenze
ricavate dalla mole di dati interrogata. Le enormi potenzialità connesse al dato possono essere
rese effettive solo per mezzo di un’adeguata dotazione tecnologica, che permetta di utilizzare
questa ingente massa di informazioni in una logica predittiva e non unicamente reattiva,
nell’ottica di un’effettiva azione preventiva contro i fenomeni fraudolenti.
Una soluzione tecnologica che possa assolvere tale compito dovrà quindi essere connotata da
elementi caratterizzanti quali:


la capacità di gestire ed utilizzare in ottica antifrode grandi quantità di dati non strutturati e
provenienti da fonti informative multiple e anche significativamente difformi fra loro;
la velocità nell’individuare e disporre dei dati utili all’elaborazione, tendendo il più possibile
all’elaborazione in tempo reale;
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 13/18



la rapidità nell’ottenere i risultati dell’analisi svolta sui dati interrogati;
l’adozione ed implementazione di tecniche innovative di analisi dei dati, differenti e
maggiormente accurate rispetto a quelle tradizionali e più note;
l’abilità nell’individuare relazioni e nessi fra dati apparentemente non correlati fra loro. A
titolo esemplificativo, le relazioni riconosciute potrebbero essere proficuamente utilizzate al fine
di implementare meccanismi di alerting finalizzati a segnalare automaticamente e
puntualmente alle risorse dell’unità sinistri/antifrode la presenza di situazioni sospette; queste
potrebbero essere imputabili alla ricorrenza di particolari elementi o somme di elementi (ad
esempio, il medesimo soggetto coinvolto in più sinistri differenti in un arco di tempo
relativamente ridotto, magari nella medesima città o quartiere) o all’individuazione di legami fra
eventi, persone, luoghi distinti.
In quest’ottica una soluzione innovativa per il fraud management, che integri tali nuove
caratteristiche e funzionalità perseguendo le tradizionali finalità di prevenzione dai fenomeni
fraudolenti, dovrà essere basata su un approccio “Big Data”. Tale soluzione dovrà poter sfruttare
le potenzialità insite nella mole di informazioni ad oggi disponibili per le compagnie assicurative,
estraendone il “valore aggiunto” e fornendo alle strutture antifrode aziendali un’arma sofisticata per
combattere le frodi già poste in essere, oltre a prevenire i reati fraudolenti che ancora non sono stati
realizzati. Inoltre, un sistema di tipo Big Data è in grado di individuare tutte le relazioni tra i dati in
maniera nativa permettendo all’operatore di avere evidenza delle stesse in maniera immediata.
In sintesi, si otterrebbe il duplice vantaggio di avere una base dati più ricca dal punto di vista del
numero dei dati e delle fonti, oltre ad includere la fondamentale capacità di individuare ed
analizzare le relazioni. In questo modo è possibile non solo affinare le regole di scoring - che
potrebbero giovare di una base dati molto più ampia - ma di includere anche regole che si basino
sull’analisi delle relazioni.
Per formulare la propria proposta, GFT non si è posta quale obiettivo la mera costruzione di un
sistema antifrode che, seppure con diversi livelli di complessità, è ormai già presente in quasi tutte
le compagnie assicurative; piuttosto, si è concentrata su quell’area che risulta essere problematica
per la maggior parte dei sistemi disponibili e che, al tempo stesso, sta diventando sempre più
necessaria per un’efficace lotta alle frodi: l’analisi delle relazioni nascoste. L’intento della
soluzione di GFT è quello di arricchire i sistemi anti frode di capacità relative alla scoperta e alla
valutazione in real time di legami nascosti tra soggetti e di fornire la possibilità di analizzare questi
legami.
Il sistema proposto si compone essenzialmente di quattro parti:




l’interfaccia di acquisizione dei dati;
il motore di elaborazione dei dati;
il motore di scoring in tempo reale per valutare eventuali relazioni sospette tra i soggetti
coinvolti nel sinistro;
l’interfaccia grafica di visualizzazione e analisi delle relazioni individuate.
Il motore di elaborazione può acquisire informazioni da fonti distinte, quali il sistema sinistri, il
sistema di portafoglio o il CRM della compagnia, liste interne o esterne (banche dati di settore).
L'acquisizione dei dati non comporta la creazione di schemi/database dedicati, come nell'approccio
tradizionale: i dati sono semplicemente "salvati come arrivano" e non c’è nessuno
schema/premodellizzazione dei dati richiesta (l’approccio Big Data è infatti definito "schemaless").
I dati sono elaborati dal motore, basato su tecnologia Apache Hadoop, che come risultato produce:
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 14/18


una serie di documenti (il volume dei dati acquisiti nella fase di test è nell'ordine dei milioni)
relativi ai sinistri ed ai soggetti individuati che vengono indicizzati nel motore di ricerca
3
ElasticSearch ;
una rete di relazioni che viene memorizzata in un database specializzato per la gestione dei
grafi, creata a partire dai legami che sono stati individuati nei sistemi (ad esempio, dal
portafoglio estraiamo i legami tra i beneficiari di una polizza vita ed il contraente, dal CRM le
relazioni censite tra i singoli soggetti, dai sinistri si ricava una relazione tra tutti i soggetti che
sono stati coinvolti in qualche modo nel medesimo evento sinistroso). La rete risultante è
composta da milioni di nodi e milioni di relazioni tra essi;
La scelta tecnologica di un database orientato ai grafi è principalmente motivata dalla convinzione
che sia la struttura più idonea per individuare eventuali relazioni non di primo livello tra diversi
soggetti.
Ma cosa succede quando l'utente interroga il nostro sistema?



Dapprima sono ricercati tutti i riferimenti associati ai soggetti che sono stati inseriti
dall'operatore (la tecnologia ElasticSearch si è rivelata particolarmente idonea allo scopo);
quindi, viene “scandagliata” la rete di relazioni alla ricerca di eventuali nessi “nascosti” che
comprendano i soggetti indicati dall'operatore;
i risultati ottenuti vengono quindi processati in tempo reale dal motore di scoring che, sulla
base delle regole definite, determina lo score che rappresenta un livello di alert per una
successiva indagine: più è alto, più è probabile di essere in presenza di un legame sospetto tra
i soggetti coinvolti.
4
L’intero processo, sui volumi indicati, viene effettuato in tempi di circa 1 secondo .
Il semplice click fatto dall’operatore nasconde quindi in realtà la ricerca attraverso milioni di
documenti e milioni di relazioni che sono state create a partire da dati provenienti da sistemi
eterogenei/non comunicanti tra loro e la loro elaborazione in tempo reale. Oltre all’alert, l’operatore
avrà poi a disposizione uno strumento grafico specializzato per visualizzare e analizzare le
relazioni che coinvolgono gli elementi correlati al sinistro (network analysis).
Quali sono i vantaggi che questa soluzione basata su BigData ha rispetto alle soluzione
"tradizionali" ?



Maggiore semplicità nel processo di acquisizione ed integrazione nel motore di nuove
informazioni provenienti dagli stessi sistemi o da nuove sorgenti (arricchimento);
maggiore semplicità nell’esecuzione di interrogazioni complesse sui dati: realizzare una ricerca
"Google-like" o creare un grafo di relazioni non sono operazioni "naturali" per i sistemi
tradizionali (transazionali), e sono sicuramente di complessa realizzazione;
maggiore semplicità nel modificare o introdurre nuove regole per il calcolo dello scoring:
l’utilizzo di tecnologie “schemaless” rende l’impianto più flessibile rispetto ad una soluzione
standard (tipicamente una sistema relazionale tradizione viene modellato sulla base delle
interrogazioni che gli devono essere sottoposte; quindi, modificare le regole può comportare
non solo la variazione della logica applicativa ma anche il cambiamento dello schema dei dati,
con tutte le conseguenze che ciò comporta).
3
La scelta della tecnologia ElasticSearch è imputabile al fatto che essa consente di recuperare questi documenti in tempo
reale, con una modalità di ricerca “Google-like”
4
Dati rilevati a partire da una fonte di circa 65 milioni di informazioni elaborate su una normale PC
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 15/18
Con "semplicità" non si intende affermare che sia più facile utilizzare queste tecnologie rispetto alle
attuali; tuttavia, pur includendo nella valutazione le complessità legate all’apprendimento di questa
tecnologia, è innegabile che le possibilità offerte dal Big Data comportino vantaggi in termini di
capacità di analisi dei dati, rendendo tale approccio di sicuro interesse nel contesto della lotta alle
frodi assicurative.
Quale ulteriore punto di riflessione, è opportuno sottolineare che la soluzione di GFT utilizza
esclusivamente software open-source (Apache Hadoop, ElasticSearch, OrientDB) con vantaggi dal
punto di vista dei costi di implementazione e relativa facilità di integrazione nei sistemi in essere.
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 16/18
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 17/18
Contatti:
Prof.ssa Chiara Frigerio
CeTIF - Centro di Ricerca su Tecnologie, Innovazione e servizi Finanziari
Università Cattolica del Sacro Cuore
| Via San Vittore, 18
20123 Milano | Italia
T +39 02 72342590 | F +39 02 72348340 | [email protected]
Ing. Umberto Zanchi
GFT Italia S.r.l. | Via A. Campanini, 6
20124 Milano | Italia
T +39 02 58158-1 | F +39 02 58158-621 | [email protected]
I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF
Marzo 2014
Pagina 18/18