I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 ll Centro di Ricerca in Tecnologie, Innovazione e Servizi Finanziari (CeTIF) dal 1990 realizza studi e promuove ricerche sulle dinamiche di cambiamento strategico e organizzativo nei settori finanziario, bancario e assicurativo. Ogni anno CeTIF attiva più di 15 Competence Centre e Osservatori, cui possono partecipare gli oltre 10.000 professionisti che costituiscono il suo network e organizza oltre 10 workshop dedicati a banche e assicurazioni, con l’obiettivo di favorire fra i partecipanti lo scambio di esperienze su temi specifici e sull’adozione di pratiche innovative. A tutto ciò si aggiungono i progetti di ricerca internazionali realizzati in collaborazione con le principali università e società di analisi e di ricerca presenti nel mercato. Le attività si focalizzano principalmente sugli effetti dello sviluppo di nuove strategie, sull’innovazione normativa, sull’approfondimento di prassi organizzative e di processo e sugli effetti dell’introduzione dell’innovazione tecnologica. Tra i partner istituzionali di CeTIF figurano: Banca d’Italia, ISVAP, ABI, ANBP, ANIA, AIPB e CONSOB. Dal 2011 in seno a CeTIF è stato costituito il CEFIRS - Centre for European Financial Regulations Studies - un Osservatorio Permanente sulla regolamentazione nel settore finanziario, bancario e assicurativo. Il CeTIF è, inoltre, socio fondatore del FIT: l’Associazione europea dei centri di ricerca sulla finanza e l’Information Technology. Per ulteriori informazioni www.cetif.it GFT Italia è parte del Gruppo GFT Technologies AG, basato in Germania e provider mondiale di soluzioni IT per il settore finanziario, bancario e assicurativo presente in Spagna, Regno Unito, Francia, Svizzera, Brasile e Stati Uniti. GFT Italia si avvale di oltre 500 addetti presso le sedi di Milano, Firenze, Siena, Torino, Parma, Piacenza, Padova, Genova e Palermo e vanta un portafoglio di offerta che comprende Business & IT Consulting, Digital Marketing & Communication, IT Solution&Services e Managed Services. GFT Italia collabora con i propri clienti condividendo esigenze, processi decisionali e opportunità di business coniugando le solide esperienze e la profonda conoscenza dei diversi settori di mercato con le competenze specialistiche di Program Management & Consulting, System Integration e Service Management Per ulteriori informazioni www.gft.com/it I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 2/18 Contenuto 1 1.1 2 2.1 3 3.1 4 4.1 5 5.1 Le frodi assicurative: lo scenario italiano ed europeo ............................................................ 4 Le frodi assicurative: lo scenario italiano ed europeo ................................................................ 4 Compagnie assicurative e lotta alle frodi: modelli organizzativi ............................................ 7 Compagnie assicurative e lotta alle frodi: modelli organizzativi ................................................. 7 Il valore delle informazioni: i Big Data ....................................................................................... 9 Il valore delle informazioni: i Big Data ........................................................................................ 9 I Big Data a servizio del fraud management assicurativo .....................................................11 I Big Data a servizio del fraud management assicurativo ........................................................11 Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT ...............13 Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT .....................13 I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 3/18 1 Le frodi assicurative: lo scenario italiano ed europeo 1.1 Le frodi assicurative: lo scenario italiano ed europeo La peculiarità dei fenomeni fraudolenti che connotano il sistema assicurativo italiano è 1 immediatamente deducibile analizzando la definizione che alcune compagnie nazionali hanno identificato come appropriata per definire il fenomeno fraudolento nel nostro Paese: la frode è identificabile con quei fenomeni del ramo danni riconducibili a reato, che affliggono principalmente il ramo Auto, ma anche rami differenti da quello RC (quali il ramo danni elementari e quello infortuni) seppure in misura meno marcata. Se nella definizione possono certamente essere fatti rientrare la falsa certificazione, la simulazione del fatto e il falso ideologico, da essa devono invece essere esclusi tutti i fenomeni speculativi, quali la sovrastima del danno a cose o persone; questo perché in uno scenario quale quello italiano, nel quale è diffusa la tendenza a ritoccare all’insù i danni riscontrati nel verificarsi di un evento sinistroso, una definizione estensiva del fenomeno finirebbe per far rientrare nel perimetro delle frodi assicurative una grande maggioranza dei sinistri denunciati alle compagnie. Il sistema Italia è contraddistinto inoltre da una tendenza a non identificare la frode alle assicurazioni come un evento criminoso, ma come un atto di furbizia o di astuzia; la maggior parte degli assicurati è convinta che l’assicurazione «guadagni troppo alle loro spalle» e dunque la frode, poiché idealmente condotta contro l’assicurazione stessa, è quasi percepita come uno strumento per veder saldato il credito che l’assicurato ritiene di vantare nei confronti della compagnia. Tuttavia, la realtà dei fatti è ben differente: manca la consapevolezza del fatto che il numero e l’entità dei danni da risarcire, indipendentemente dal fatto che siano questi reali o fraudolenti, incide direttamente sui premi che ciascun assicurato dovrà corrispondere nel futuro. Le frodi inducono un elevato spreco di risorse che a sua volta determina un aumento nell’importo dei premi assicurativi richiesti alla clientela; il circolo vizioso innescato si ripercuote sul consumatore finale, che si ritrova a dover pagare un prezzo superiore per l’elevato costo di gestione dei sinistri sopportato dalle compagnie. Date queste premesse, si evince che le frodi rappresentano un fenomeno che necessita di essere gestito in modo ottimale al fine di contenerne gli impatti negativi sul sistema nel suo complesso. Con riferimento al nostro Paese, negli ultimi anni si è assistito ad una contrazione nella raccolta del ramo danni, dovuta principalmente ad una diminuzione del ramo RC Auto. La riduzione dei premi raccolti è andata di pari passo con la diminuzione dei sinistri accaduti e denunciati e che hanno dato o daranno luogo a un risarcimento; infatti, il numero totale degli incidenti nel 2012 è stato pari a 2,3 milioni, con una diminuzione del 15,3% rispetto al 2011 . Inoltre, i risultati negativi del ramo si accompagnano ad una particolare esposizione dello stesso al rischio frodi. Analizzando i dati IVASS relativi al 2011, i sinistri riconducibili a fenomeni fraudolenti a danno delle imprese assicurative sono stati 54.502, con un’incidenza del 2,04% sulla globalità dei sinistri del ramo RC Auto. Si registra un importo totale di 281,9 milioni di Euro, pari al 2,42% dell’ammontare complessivo dei risarcimenti e all’1,59% dei premi del ramo. È opinione comune che queste statistiche probabilmente non riflettano la reale portata del fenomeno italiano, non riportando alcuna traccia delle frodi sommerse, cioè quelle attuate, ma non accertate dal sistema assicurativo. Tale stato delle cose trova conferma nel momento in cui si procede a confrontare il fenomeno delle frodi italiano con quello europeo; in Europa la media dei 1 Definizione condivisa dal gruppo di lavoro partecipante al Competence Centre CeTIF 2013, dal titolo “Fraud Management assicurativo 2013: processi e sistemi alla luce della nuova normativa”, svoltosi nel periodo marzo-maggio 2013 con la partecipazione di 12 compagnie e gruppi assicurativi operanti nel mercato italiano. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 4/18 sinistri fraudolenti nel ramo RC Auto si attesta infatti intorno al 10%, contro il poco realistico 2,3% in Italia (Figura 1). Figura 1 - I fenomeni fraudolenti in Italia e in Europa Fonte: rielaborazione CeTIF di dati IVASS 2011 La rilevanza del fenomeno e i significativi effetti negativi che le frodi possono generare sul sistema assicurativo italiano hanno indotto l’autorità ad affidare ad IVASS - Istituto per la Vigilanza sulle Assicurazioni l’incarico di organismo nazionale unico atto alla prevenzione delle frodi nel settore dell’assicurazione e della responsabilità civile derivante dalla circolazione dei veicoli a motore. Sebbene nel contesto europeo si siano fatte in alcuni casi scelte differenti - affidando l’attività antifrode a enti privati senza scopo di lucro (a titolo esemplificativo, in Francia con Alfa e Agira e nel Regno Unito con CIFAS - Credit Industry Fraud Avoidance System) o a più autorità distinte contemporaneamente, ciascuna con un proprio ambito di operatività - appare in ogni caso evidente che in tutti i paesi dell’Unione il problema è ben noto e sono state poste in essere azioni molteplici per tentare di affrontarlo ed arginarlo nel più efficace dei modi. In generale, trattandosi di un fenomeno che ha impatti sul sistema assicurativo nel suo complesso, è opportuno sottolineare come nessuno dei suoi attori possa essere escluso dal porre in essere azioni finalizzate alla prevenzione, all’individuazione e alla lotta alle frodi. Le azioni correttive sono dunque attese sia da parte della o delle autorità incaricate dell’azione antifrode, sia da parte del legislatore, oltre che ovviamente anche da parte delle compagnie assicurative stesse. In Italia dovranno pertanto rendersi operativi: IVASS, l’autorità, che deve strutturarsi al fine di svolgere il proprio ruolo all’interno del sistema assicurativo italiano come principale organismo antifrode nel modo più efficace ed efficiente possibile; il legislatore, che deve intervenire con provvedimenti che prendano in considerazione il trade off tra tutela del cliente e possibilità di contrastare opportunamente i fenomeni fraudolenti; I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 5/18 le compagnie assicuative, che si devono strutturare sia dal punto di vista organizzativo sia da quello tecnologico al fine di prevenire, individuare e contrastare il maggior numero di frodi possibili. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 6/18 2 Compagnie assicurative e lotta alle frodi: modelli organizzativi 2.1 Compagnie assicurative e lotta alle frodi: modelli organizzativi Prevenire e contrastare i fenomeni fraudolenti all’interno del contesto assicurativo implica notevoli sforzi da parte delle compagnie le quali hanno dovuto investire significativamente in tre aree essenziali per l’efficace funzionamento di un sistema di fraud management: modelli organizzativi modelli operativi sistemi informativi. Infatti, la natura multiforme dei fenomeni fraudolenti e le difficoltà intrinseche alla loro prevenzione ed individuazione inducono le compagnie a porre in essere profondi cambiamenti sia a livello operativo-organizzativo sia a livello di dotazioni informatiche delle quali le aziende sono dotate. In particolare, le persone e la loro organizzazione sono fondamentali ai fini dell’istituzione di un efficace sistema di fraud management poiché le risorse umane rappresentano l’elemento in grado di rendere effettivamente e correttamente operative le linee guida e le disposizioni che la compagnia ha previsto per la lotta alle frodi. È inoltre opinione comune che anche il più sofisticato dei sistemi di fraud management non potrà mai sostituire integralmente la componente umana che caratterizza i processi di gestione delle frodi. Le procedure manuali rappresentano dunque un necessario complemento all’operatività del sistema informativo, soprattutto nelle fasi di detection e 2 di investigation , oltre che nell’identificazione delle frodi interne, perpetrate all’interno della compagnia stessa, spesso con il coinvolgimento diretto di suoi fiduciari. Tali tipi di attività, scarsamente standardizzabili e connotate da elevata variabilità, possono essere gestite in modo ottimale soltanto dagli operatori dedicati alle attività antifrode. La componente “umana” è essenziale per una corretta comprensione e qualificazione del fenomeno di frode, per la gestione delle eccezioni, oltre che per configurare ed alimentare correttamente le tecnologie adottate dalle imprese assicurative. Le compagnie sono tutte dotate di strutture organizzative ad hoc (unità antifrode aziendale) dedicate all’individuazione delle linee guida per lo svolgimento dell’attività antifrode e alla loro implementazione all’interno dell’azienda. Ciascuna impresa assicurativa ha adottato un sistema organizzativo diverso a seconda delle proprie peculiarità e della propria cultura aziendale, ma sono evidenziabili alcune caratteristiche che il comparto assicurativo italiano tende a riconoscere come necessarie per identificare un modello di fraud management adeguato. Innanzitutto, è essenziale il presidio da parte dell’unità antifrode dell’intero ciclo di gestione della polizza e del sinistro; in questo senso, il fatto che l’unità antifrode abbia una visione complessiva di tutte le fasi del processo rappresenta un fattore critico di successo in grado di attuare un migliore contrasto alle frodi. Soltanto se si conosce la totalità del processo e se lo si 2 Il processo di gestione della frode si articola in tre fasi fondamentali: Fase di Prevention: insieme delle attività finalizzate a prevenire il verificarsi di fenomeni fraudolenti e/o l’assunzione del rischio di frode da parte della compagnia (ossia prima che essi si traducano in un fenomeno concreto che necessiti di essere gestito da parte dell’impresa); Fase di Detection: operazioni volte ad individuare i casi di sospetta frode che debbano essere segnalati all’unità antifrode per lo svolgimento delle attività di investigazione, riducendo l’incidenza dei casi di “falsi positivi” segnalati all’unità antifrode; Fase di Investigation: attività di analisi dei casi segnalati come possibili frodi al fine di verificarne l’effettiva natura fraudolenta I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 7/18 monitora integralmente si sarà in grado di individuare con maggiore abilità gli ambiti e le attività più critiche e che possono quindi più facilmente dare adito a tentativi di frode. Inoltre, di primaria rilevanza risulta essere l’attività svolta dai fiduciari e, in particolare, il ruolo giocato dal liquidatore nell’individuazione di possibili frodi nel corso del processo di liquidazione. Il liquidatore ha la visione complessiva del processo di gestione del sinistro ed è quindi in una condizione favorevole al fine di individuare i sinistri sospetti e di procedere con la segnalazione all’unità antifrode preposta; il suo grado di competenza in merito alla capacità di riconoscere se un evento sinistroso ha caratteristiche tali da dover essere effettivamente gestito dall’unità antifrode o se si tratta invece di un “falso positivo” (ossia un sinistro che appare fraudolento ma che in realtà non lo è) è essenziale per garantire l’ottimale operatività dell’unità. È necessario però sottolineare come ad ostacolare l’efficacia dell’azione antifrode dei liquidatori si ponga spesso il sovraccarico di attività a cui essi sono sottoposti; le azioni antifrode che gli si richiede di porre in essere vanno a sommarsi alla molteplicità dei task che devono compiere abitualmente nel corso del processo di liquidazione, generando carichi di lavoro che sono spesso di difficile gestione. La complessità e la mole di attività inducono spesso i liquidatori a svolgere controlli limitati in ambito antifrode con una conseguente minore efficacia del fraud management aziendale. Estendendo l’analisi a tutti i fiduciari, si evince che la principale criticità riscontrata con riferimento al loro ruolo di lotta ai fenomeni fraudolenti è riconducibile alla costituzione di un ecosistema compagnie-fiduciari-agenti nel quale si dovrebbero realizzare costanti scambi e condivisioni delle informazioni relative ai sinistri e alle frodi sospette, così da garantire un continuo aggiornamento sulle attività antifrode in corso di svolgimento. I processi di comunicazione fra questi attori del sistema assicurativo spesso non vengono svolti oppure risultano essere poco tempestivi e connotati da elevata imprecisione nelle informazioni circolarizzate, con grave nocumento della qualità del processo antifrode. I fiduciari risultano essere generalmente scarsamente predisposti alla collaborazione con gli altri attori del sistema, ragione per la quale molte compagnie hanno istituito dei sistemi di incentivazione, rivolti in particolare ai medici, al fine di sensibilizzarli e incoraggiarli a contribuire fattivamente al contrasto e alla prevenzione dei fenomeni fraudolenti. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 8/18 3 Il valore delle informazioni: i Big Data 3.1 Il valore delle informazioni: i Big Data La penetrazione capillare della tecnologia nella nostra società, la diffusione dei social media e l’inarrestabile evoluzione dei sistemi informatici genera un’ingente ed estremamente variegata quantità di informazioni. Nell’ultimo decennio si è assistito alla rapida diffusione di nuove «sorgenti di informazione», quali i Social Media e i Social Network, i dispositivi mobile, reti di sensori e strumenti scientifici sempre più sofisticati. Da questi fenomeni innovativi è possibile ricavare grandissimi volumi di dati, non necessariamente strutturati, la cui validità è spesso legata al momento in cui vengono generati. Le informazioni costituiscono una necessità fondamentale, essendo alla base di qualsiasi processo decisionale; tuttavia il solo fatto che le informazioni esistano non è di per sé sufficiente a costituire un effettivo valore. Sono necessarie almeno 2 condizioni affinché questa moltitudine di dati si trasformi in “patrimonio informativo”: Completezza: le informazioni devono avere un grado di dettaglio elevato e devono provenire da molteplici fonti per poter valutare un elemento da diversi punti di vista; Tempestività: il valore di un’informazione è direttamente proporzionale alla sua “freschezza”, soprattutto in un contesto come quello attuale dove la velocità di generazione delle informazioni è estremamente elevata; se ne desume che è fondamentale che le informazioni raccolte possano essere consultate rapidamente. Vi è poi un ulteriore aspetto che deve essere considerato: il valore informativo di un insieme di dati non è costituito solo dalla somma delle informazioni di ogni singolo dato ma anche e soprattutto dalle relazioni che sussistono tra i dati stessi. Le relazioni tra i dati danno vita a nuove informazioni, potenzialmente in un numero più elevato rispetto ai dati di partenza; tali nessi costituiscono un notevole valore aggiunto “nascosto” a cui però non è facile accedere con i sistemi tradizionali (transazionali). L’accesso alle informazioni secondo le modalità descritte è una necessità pressante per le tutte le aziende, in particolare per quelle che operano nel settore dei servizi, dove il sempre più elevato livello di competitività del mercato richiede la capacità di effettuare valutazioni complesse in tempi rapidi per intervenire tempestivamente sui fenomeni problematici. Tutte le aziende di dimensioni medio - grandi dispongono di grandi database in cui sono contenute moltitudini di informazioni relative al proprio business. Queste strutture informative, però, pur essendo estremamente ricche di dati, sono poco flessibili e comportano alcuni limiti, non sempre facilmente risolvibili: Mancanza di comunicazione: sono quasi sempre strutture dipartimentali e costituite da sistemi “monolitici” non in comunicazione tra loro. La diretta conseguenza di questa struttura si sostanzia nel fatto che ogni singola interrogazione non è esaustiva; la mancanza di comunicazione tra le varie basi dati dipartimentali rende necessario fare più interrogazioni per ottenere le informazioni necessarie da tutte le basi dati (a meno di replicare le informazioni nelle varie basi dati); Analisi delle relazioni: con i sistemi tradizionali è estremamente complesso quando non impossibile analizzare le relazioni che sussistono fra dati distinti; Estendibilità della base dati: includere nuove fonti in una base dati “tradizionale” è un’operazione complessa con ricadute non trascurabili sul fronte dei tempi e dei costi; Accesso a fonti esterne all’azienda: solitamente sono presenti solamente i dati provenienti dall’ambito aziendale, mentre i dati provenienti da fonti esterne richiedono operazioni di normalizzazione, più o meno onerose. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 9/18 In altri termini: il problema di oggi non è il reperire l’informazione ma la capacità di gestirla, analizzarla, sintetizzarla e di estrarne il «valore aggiunto» in modo efficiente e scalabile. I gruppi di informazioni la cui mole e complessità sono tali da rendere necessari nuovi approcci, architetture e tecnologie che ci consentano di gestirli, sono definiti “Big Data”. L’enorme volume di questi dataset, la loro eterogeneità e quella delle fonti da cui provengono, il bisogno di poter effettuare le analisi in tempi brevissimi per evitare che il valore informativi del dato si deteriori a causa dell’obsolescenza e, soprattutto, la necessità estrarre il «valore aggiunto» in esse nascosto in termini di relazioni tra i dati, mettono in campo scenari la cui complessità genera una crisi dei sistemi tradizionali. Comunemente, i sistemi basati su un approccio “Big Data” vengono descritti mediante la definizione delle “3 V”, che permette di individuare facilmente alcuni degli elementi caratterizzanti di questa tecnologia: Volume: i sistemi basati sulla tecnologia Big Data sono in grado di acquisire, memorizzare e consultare enormi quantità di dati che comporterebbero significative difficoltà se approcciate mediante le tecnologie tradizionali; Variety: questa è forse una delle possibilità più interessanti dei sistemi Big Data, ossia la capacità di acquisire dati da molte fonti eterogenee e senza la necessità che gli stessi siano organizzati secondo una struttura predefinita. I sistemi Big Data possono acquisire dati strutturati, semi-strutturati o non strutturati (raw data) provenienti da molte fonti diverse e la base dati può essere estesa con nuove fonti in tempi ridotti rispetto ai sistemi RBDMS; Velocity: l’abilità dei sistemi Big Data di poter acquisire dati senza la necessità di memorizzarli secondo un formato predefinito, permette di consultare i dati acquisiti dopo breve tempo dall’acquisizione, riducendo sensibilmente il rischio di obsolescenza degli stessi. Questa definizione risulta essere riduttiva, perché non include una delle caratteristiche più interessanti e maggiormente differenzianti dei Big Data, ossia la capacità di individuare ed analizzare le relazioni nascoste tra i dati. Se il valore informativo di un dataset è superiore alla somma delle informazioni legate ai singoli dati, grazie alle relazioni esistenti fra essi, spesso queste relazioni sono “nascoste” in quanto non sono indagabili con un sistema informativo tradizionale. I sistemi Big Data, invece, sono in grado di individuare queste relazioni in maniera nativa. Questa possibilità aumenta in maniera sensibile il valore del proprio patrimonio informativo permettendo di fare analisi sul tipo e la quantità di relazioni che interconnettono i dati; in questo modo è anche possibile individuare le relazioni tra elementi provenienti da fonti diverse. L’approccio Big Data permette non solo di utilizzare una mole più grande di dati e una varietà più ampia di fonti, indipendentemente dalla struttura che esse hanno, ma soprattutto di “estrarre” molte più informazioni dai dati sfruttandoli in maniera più completa ed efficace. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 10/18 4 I Big Data a servizio del fraud management assicurativo 4.1 I Big Data a servizio del fraud management assicurativo Se le azioni organizzative e di processo che le compagnie assicurative hanno intrapreso per migliorare la propria capacità di prevenire e contrastare le frodi rappresentano un elemento essenziale della strategia di fraud management delle imprese, un approccio efficace per la gestione di tali fenomeni non può però prescindere dall’adozione di strumenti informativi idonei a contrastare in maniera efficace il rischio di frode. Inoltre deve essere tenuto in debito conto il sempre più incisivo fenomeno delle frodi organizzate che, sebbene numericamente inferiori rispetto alle frodi occasionali (anche definite “opportunistiche), generano un aggravio economico maggiore per le compagnie; inoltre, essendo organizzate da “professionisti della frode” (spesso dalla stessa criminalità organizzata) è estremamente complesso rilevarle, perché vengono prese tutte le contromisure atte a impedire che la frode venga scoperta. I frodatori stessi evolvono le loro tecniche di azione per evitare di venire individuati dalle regole dei motori antifrode e le frodi diventano sempre più complesse e articolate, uscendo dai soli contesti locali per andare a radicarsi nell’intero territorio nazionale, rendendo sempre più complesso il lavoro delle unità antifrode. Gli strumenti tecnologici aiutano a superare le difficoltà operative della struttura di controllo adibita alle funzioni di individuazione e gestione delle frodi, facilitando l’analisi di quantità di dati massive per individuare eventuali fenomeni “occulti” e potenziali schemi di frode. Per tale ragione, è proprio l’area dei sistemi informativi quella nella quale le imprese di assicurazione desiderano investire con maggior urgenza al fine di migliorare l’efficienza e l’efficacia dei processi di fraud management. Tuttavia, la mancanza o l’incompletezza dei dati relativi ai soggetti frodatori e ai sinistri denunciati rendono complicato il monitoraggio delle situazioni potenzialmente rischiose e riducono significativamente la possibilità di dedurre con sufficiente anticipo l’esistenza di schemi fraudolenti ricorrenti, minando alla base l’efficacia di qualsiasi tecnologia di fraud management. Allo stesso tempo, risultano essere spesso assenti anche adeguati sistemi integrati di reportistica e tracciatura dei rapporti in essere con i propri contraenti. È dunque evidente quanto sia rilevante disporre di una base di dati completa relativa ai sinistri della compagnia, dalla quale dedurre i comportamenti fraudolenti sulla base di schemi e modelli efficaci nell’individuare le frodi potenziali con lo scopo di gestirle nella maniera opportuna. I dati storici relativi ai sinistri denunciati presso la compagnia potrebbero essere integrati anche dall’utilizzo di informazioni raccolte presso soggetti terzi (ad esempio, altre compagnie assicurative, del medesimo gruppo o di gruppo differente), al fine di migliorare la quantità dei dati a disposizione e incrementare dunque la possibilità di individuare con successo possibili schemi di frode. Tuttavia, tali logiche di scambio massivo di informazioni risultano essere in contrasto con le previsioni normative attuali ed inoltre richiederebbero un livello di maturità delle dotazioni tecnologiche finalizzate alla gestione dei fenomeni fraudolenti superiore rispetto a quello attualmente riscontrabile nel settore. Lo scambio di informazioni tra compagnie e soggetti terzi potrà probabilmente rappresentare un successivo step nel percorso di adattamento dei supporti informatici delle compagnie alle esigenze di fraud management. Inoltre, i dati detenuti presso i database delle compagnie potrebbero essere integrati con le informazioni presenti nelle banche dati istituzionali (IVASS, ANIA, Casellario Centrale Infortuni INAIL, ecc.) e non istituzionali presenti nel panorama italiano al fine di rendere maggiormente esaustivo il data set utilizzato per l’individuazione delle frodi. Con riferimento alle banche dati non istituzionali, oltre ai dati delle black-box eventualmente installate dai clienti e alle informazioni di geolocalizzazione - ricavabili dai sistemi antifurto satellitari, dalle telecamere per il controllo della velocità e dai dispositivi telepass - un ambito di particolare interesse è quello del flusso quotidiano di input proveniente dai social media. Sebbene l’incertezza normativa e le regole di visibilità I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 11/18 pubblica dei dati non permettano attualmente di utilizzare in maniera puntuale queste informazioni per verificare l’esistenza di potenziali fenomeni fraudolenti, i social media rappresentano un canale di raccolta di informazioni di rilevanza crescente e che sta suscitando l’attenzione anche delle compagnie assicurative del nostro paese. È tuttavia opportuno specificare che la presenza di database ricchi di dati completi, aggiornati e provenienti da fonti plurime potrebbe non garantire di per sé un efficace funzionamento del sistema di gestione delle frodi. Se è vero che le informazioni rappresentano l’unità fondamentale di un sistema di fraud management ottimale, i “Big Data” rappresentano un patrimonio di grandissimo valore per l’azienda che li detiene, ma sono al contempo una ricchezza connotata da una particolare complessità di immagazzinamento, gestione ed elaborazione. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 12/18 5 Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT 5.1 Migliorare le regole antifrode tramite le tecnologie BIG DATA: la proposta GFT I sistemi antifrode tradizionali sono quasi sempre basati su un set di regole, più o meno sofisticate, che permettono di valutare il rischio di frode di un singolo sinistro sulla base di alcuni parametri (ad esempio, il numero di sinistri precedenti dell’assicurato, la dinamica anomala di un sinistro, la prossimità alla scedenza di una polizza, ecc.). Tali sistemi hanno dimostrato una discreta efficacia nell’individuare alcune delle tipologie più comuni di frode opportunistica, tuttavia non sono in grado o hanno capacità molto limitate - di individuare gli schemi complessi propri delle frodi organizzate, proprio perché la valutazione viene effettuata sulla base degli elementi legati ai sinistri in corso di analisi. Con questi sistemi, basati sulla sola valutazione delle regole, si riesce a “coprire” molte aree di indagine relative alle frodi perpetrate, ma risulta molto complicato includere nei parametri di indagine elementi relativi a eventuali relazioni indirette con altri sinistri (ad esempio, se un soggetto ha ricoperto il ruolo di testimone in più sinistri, se gli stessi soggetti sono stati coinvolti in più sinistri magari con ruoli diversi, se lo stesso schema di frode si sta ripetendo in regioni diverse). L’elemento distintivo delle frodi organizzate è però proprio la rete di relazioni “nascoste”che sussiste tra i soggetti che reiterano le frodi; l’individuazione tempestiva di queste relazioni e dei soggetti che vi partecipano permette di ottenere il duplice risultato di intercettare la frode prima della fase di liquidazione e di prendere le necessarie contromisure nei confronti dei soggetti che partecipano all’organizzazione, evitando il ripetersi del fenomeno illecito da parte degli stessi. Inoltre, i sistemi tradizionali sono spesso basati su database transazionali che sono estremamente validi per individuare le modificazioni di un’informazione nel corso del tempo (ad esempio, le variazioni della documentazione allegata alla denuncia, le modifiche al contratto, ecc.) ma quasi sempre accedono alle informazioni di un numero estremamente limitato di sistemi (ad esempio, sistema sinistri, sistema di portafoglio, ecc.); questo accade perché estendere la base dati interrogata è un processo piuttosto complesso e oneroso. Una soluzione basata su un approccio di tipo Big Data permetterebbe di implementare una base dati dedicata al sistema antifrode, con un numero maggiore di dati provenienti da molte fonti eterogenee ed in particolare da fonti esterne alla compagnia; sebbene tali informazioni siano accessibili alle compagnie anche oggi, esse non sono integrate nei sistemi attuali, richiedendo quindi all’operatore distinte interrogazioni su sistemi differenti. Tanto più è ingente la quantità di dati a disposizione, quanto più risulta essere fondamentale la qualità dello strumento informativo adottato per leggere, interpretare e comunicare le evidenze ricavate dalla mole di dati interrogata. Le enormi potenzialità connesse al dato possono essere rese effettive solo per mezzo di un’adeguata dotazione tecnologica, che permetta di utilizzare questa ingente massa di informazioni in una logica predittiva e non unicamente reattiva, nell’ottica di un’effettiva azione preventiva contro i fenomeni fraudolenti. Una soluzione tecnologica che possa assolvere tale compito dovrà quindi essere connotata da elementi caratterizzanti quali: la capacità di gestire ed utilizzare in ottica antifrode grandi quantità di dati non strutturati e provenienti da fonti informative multiple e anche significativamente difformi fra loro; la velocità nell’individuare e disporre dei dati utili all’elaborazione, tendendo il più possibile all’elaborazione in tempo reale; I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 13/18 la rapidità nell’ottenere i risultati dell’analisi svolta sui dati interrogati; l’adozione ed implementazione di tecniche innovative di analisi dei dati, differenti e maggiormente accurate rispetto a quelle tradizionali e più note; l’abilità nell’individuare relazioni e nessi fra dati apparentemente non correlati fra loro. A titolo esemplificativo, le relazioni riconosciute potrebbero essere proficuamente utilizzate al fine di implementare meccanismi di alerting finalizzati a segnalare automaticamente e puntualmente alle risorse dell’unità sinistri/antifrode la presenza di situazioni sospette; queste potrebbero essere imputabili alla ricorrenza di particolari elementi o somme di elementi (ad esempio, il medesimo soggetto coinvolto in più sinistri differenti in un arco di tempo relativamente ridotto, magari nella medesima città o quartiere) o all’individuazione di legami fra eventi, persone, luoghi distinti. In quest’ottica una soluzione innovativa per il fraud management, che integri tali nuove caratteristiche e funzionalità perseguendo le tradizionali finalità di prevenzione dai fenomeni fraudolenti, dovrà essere basata su un approccio “Big Data”. Tale soluzione dovrà poter sfruttare le potenzialità insite nella mole di informazioni ad oggi disponibili per le compagnie assicurative, estraendone il “valore aggiunto” e fornendo alle strutture antifrode aziendali un’arma sofisticata per combattere le frodi già poste in essere, oltre a prevenire i reati fraudolenti che ancora non sono stati realizzati. Inoltre, un sistema di tipo Big Data è in grado di individuare tutte le relazioni tra i dati in maniera nativa permettendo all’operatore di avere evidenza delle stesse in maniera immediata. In sintesi, si otterrebbe il duplice vantaggio di avere una base dati più ricca dal punto di vista del numero dei dati e delle fonti, oltre ad includere la fondamentale capacità di individuare ed analizzare le relazioni. In questo modo è possibile non solo affinare le regole di scoring - che potrebbero giovare di una base dati molto più ampia - ma di includere anche regole che si basino sull’analisi delle relazioni. Per formulare la propria proposta, GFT non si è posta quale obiettivo la mera costruzione di un sistema antifrode che, seppure con diversi livelli di complessità, è ormai già presente in quasi tutte le compagnie assicurative; piuttosto, si è concentrata su quell’area che risulta essere problematica per la maggior parte dei sistemi disponibili e che, al tempo stesso, sta diventando sempre più necessaria per un’efficace lotta alle frodi: l’analisi delle relazioni nascoste. L’intento della soluzione di GFT è quello di arricchire i sistemi anti frode di capacità relative alla scoperta e alla valutazione in real time di legami nascosti tra soggetti e di fornire la possibilità di analizzare questi legami. Il sistema proposto si compone essenzialmente di quattro parti: l’interfaccia di acquisizione dei dati; il motore di elaborazione dei dati; il motore di scoring in tempo reale per valutare eventuali relazioni sospette tra i soggetti coinvolti nel sinistro; l’interfaccia grafica di visualizzazione e analisi delle relazioni individuate. Il motore di elaborazione può acquisire informazioni da fonti distinte, quali il sistema sinistri, il sistema di portafoglio o il CRM della compagnia, liste interne o esterne (banche dati di settore). L'acquisizione dei dati non comporta la creazione di schemi/database dedicati, come nell'approccio tradizionale: i dati sono semplicemente "salvati come arrivano" e non c’è nessuno schema/premodellizzazione dei dati richiesta (l’approccio Big Data è infatti definito "schemaless"). I dati sono elaborati dal motore, basato su tecnologia Apache Hadoop, che come risultato produce: I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 14/18 una serie di documenti (il volume dei dati acquisiti nella fase di test è nell'ordine dei milioni) relativi ai sinistri ed ai soggetti individuati che vengono indicizzati nel motore di ricerca 3 ElasticSearch ; una rete di relazioni che viene memorizzata in un database specializzato per la gestione dei grafi, creata a partire dai legami che sono stati individuati nei sistemi (ad esempio, dal portafoglio estraiamo i legami tra i beneficiari di una polizza vita ed il contraente, dal CRM le relazioni censite tra i singoli soggetti, dai sinistri si ricava una relazione tra tutti i soggetti che sono stati coinvolti in qualche modo nel medesimo evento sinistroso). La rete risultante è composta da milioni di nodi e milioni di relazioni tra essi; La scelta tecnologica di un database orientato ai grafi è principalmente motivata dalla convinzione che sia la struttura più idonea per individuare eventuali relazioni non di primo livello tra diversi soggetti. Ma cosa succede quando l'utente interroga il nostro sistema? Dapprima sono ricercati tutti i riferimenti associati ai soggetti che sono stati inseriti dall'operatore (la tecnologia ElasticSearch si è rivelata particolarmente idonea allo scopo); quindi, viene “scandagliata” la rete di relazioni alla ricerca di eventuali nessi “nascosti” che comprendano i soggetti indicati dall'operatore; i risultati ottenuti vengono quindi processati in tempo reale dal motore di scoring che, sulla base delle regole definite, determina lo score che rappresenta un livello di alert per una successiva indagine: più è alto, più è probabile di essere in presenza di un legame sospetto tra i soggetti coinvolti. 4 L’intero processo, sui volumi indicati, viene effettuato in tempi di circa 1 secondo . Il semplice click fatto dall’operatore nasconde quindi in realtà la ricerca attraverso milioni di documenti e milioni di relazioni che sono state create a partire da dati provenienti da sistemi eterogenei/non comunicanti tra loro e la loro elaborazione in tempo reale. Oltre all’alert, l’operatore avrà poi a disposizione uno strumento grafico specializzato per visualizzare e analizzare le relazioni che coinvolgono gli elementi correlati al sinistro (network analysis). Quali sono i vantaggi che questa soluzione basata su BigData ha rispetto alle soluzione "tradizionali" ? Maggiore semplicità nel processo di acquisizione ed integrazione nel motore di nuove informazioni provenienti dagli stessi sistemi o da nuove sorgenti (arricchimento); maggiore semplicità nell’esecuzione di interrogazioni complesse sui dati: realizzare una ricerca "Google-like" o creare un grafo di relazioni non sono operazioni "naturali" per i sistemi tradizionali (transazionali), e sono sicuramente di complessa realizzazione; maggiore semplicità nel modificare o introdurre nuove regole per il calcolo dello scoring: l’utilizzo di tecnologie “schemaless” rende l’impianto più flessibile rispetto ad una soluzione standard (tipicamente una sistema relazionale tradizione viene modellato sulla base delle interrogazioni che gli devono essere sottoposte; quindi, modificare le regole può comportare non solo la variazione della logica applicativa ma anche il cambiamento dello schema dei dati, con tutte le conseguenze che ciò comporta). 3 La scelta della tecnologia ElasticSearch è imputabile al fatto che essa consente di recuperare questi documenti in tempo reale, con una modalità di ricerca “Google-like” 4 Dati rilevati a partire da una fonte di circa 65 milioni di informazioni elaborate su una normale PC I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 15/18 Con "semplicità" non si intende affermare che sia più facile utilizzare queste tecnologie rispetto alle attuali; tuttavia, pur includendo nella valutazione le complessità legate all’apprendimento di questa tecnologia, è innegabile che le possibilità offerte dal Big Data comportino vantaggi in termini di capacità di analisi dei dati, rendendo tale approccio di sicuro interesse nel contesto della lotta alle frodi assicurative. Quale ulteriore punto di riflessione, è opportuno sottolineare che la soluzione di GFT utilizza esclusivamente software open-source (Apache Hadoop, ElasticSearch, OrientDB) con vantaggi dal punto di vista dei costi di implementazione e relativa facilità di integrazione nei sistemi in essere. I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 16/18 I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 17/18 Contatti: Prof.ssa Chiara Frigerio CeTIF - Centro di Ricerca su Tecnologie, Innovazione e servizi Finanziari Università Cattolica del Sacro Cuore | Via San Vittore, 18 20123 Milano | Italia T +39 02 72342590 | F +39 02 72348340 | [email protected] Ing. Umberto Zanchi GFT Italia S.r.l. | Via A. Campanini, 6 20124 Milano | Italia T +39 02 58158-1 | F +39 02 58158-621 | [email protected] I Big Data a servizio del Fraud Management assicurativo: un’analisi a cura di GFT Italia e CeTIF Marzo 2014 Pagina 18/18
© Copyright 2024 Paperzz