Il processo di Data Discovery riguarda la raccolta e la valutazione dei dati da più fonti ed è spesso usata per studiare con maggiore facilità i trend e i pattern nascosti nei dati. Questo processo permette di esplorare visivamente i dati forniti dal modello d’analisi semplificando, ad esempio, l’individuazione di eventuali anomalie che altrimenti sarebbero difficilmente messe in evidenza con strumenti di reportistica classici. 

Oggi quasi tutte le aziende hanno a disposizione enormi quantità di dati che fluiscono da sistemi di transazioni online e tradizionali, sensori, social media, dispositivi mobili e altre fonti variegate; chi deve prendere decisioni con processi basati sui dati ha necessità di strumenti che permettano di mettere in evidenza nel modo più semplice possibile gli insight nascosti in questi dati. 

Nelle aziende più avanzate, gli strumenti di Data Discovery fanno uso di modelli di Machine Learning e di Deep Learning per aumentare i vantaggi di questo processo: in questo modo, infatti, è possibile automatizzare le scoperta dei pattern tra i dati individuando le correlazioni tra questi tramite algoritmi di apprendimento automatico precedentemente addestrati. 

L’automazione degli strumenti di Data Discovery includono delle utilità importanti come il suggerimento della sequenza di operazioni da svolgere per normalizzare i dati, come gestire i dati mancanti, quali modelli di apprendimento utilizzare o altro.

La chiarezza dei risultati forniti da questi strumenti di visualizzazione permette di semplificare così tanto l’interpretazione dei dati che questo fa sì che anche chi si occupa di business e non ha un profilo tecnico possa individuare in maniera efficace i fenomeni anomali nelle distribuzioni dei dati in quanto questi sistemi rendono le informazioni quantitative complesse più facili da interpretare; chi possiede invece un profilo più tecnico lo trova anche uno strumento adatto alla validazione dei dati del Data Warehouse o del Data Lake e per abbozzare dashboard per la presentazione delle informazioni della Business Intelligence aziendale comparando diverse fonti e presentandole graficamente in modo interattivo utilizzando, ad esempio, mappe geografiche, tabelle pivot e mappe di calore. 

Dai risultati di questi report, le organizzazioni hanno la possibilità di prendere decisioni guidate che le orientano con successo a raggiungere i loro obiettivi a breve e lungo termine, migliorare le loro strategie e avere un vantaggio competitivo nel loro settore. 

Nell’ambito del Data journalism e del Data storytelling, i vantaggi del Data Discovery vengono utilizzati per poter comunicare in modo innovativo ed immediato messaggi di diversa natura. Questo processo ha inoltre un ruolo importante anche nella validazione di prodotti in fasi successive al rilascio: infatti, man mano che si hanno a disposizione dei nuovi dati che in precedenza non erano stati presi in considerazione dai modelli di intelligenza artificiale, è utile studiare i nuovi trend in modo da non ignorare l’insorgere di nuovi pattern inizialmente non presenti nel set di dati utilizzati nell’addestramento o nel test.

È possibile distinguere due fasi principali nei processi di Data Discovery: 

  • Nella prima fase si devono preparare i dati: questo richiede delle competenze di sviluppo di modelli per fare in modo che i dati siano utilizzabili per la visualizzazione e per assicurare la validità delle informazioni; 
  • Nella seconda fase si realizzano le analisi visuali per individuare i pattern che guidano l’esperto del settore nel processo decisionale.

Vediamo adesso quali sono i vantaggi di utilizzare i processi di Data Discovery:

  • Permette di monitorare in tempo reale gli indicatori KPI;
  • Semplifica l’accesso alle informazioni per la loro esplorazione e analisi;
  • Consente di analizzare rapidamente diversi scenari per convalidare ipotesi tramite processi di previsione dei dati futuri;
  • Aumenta la produttività permettendo di concentrarsi sui risultati piuttosto che sulla raccolta di dati;
  • Riduce l’errore umano e introduce una serie di protocolli che standardizzano l’inserimento e la validazione dei dati;
  • Facilita l’approfondimento dei dati e la individuazione di nuove domande e insight.

Gli insight possono includere l’identificazione di problemi di business quali, ad esempio:

  • Churn rate analysis
    • Perché sto perdendo clienti? Quali motivazioni di tipo tecnico o legate alla strategia di marketing sono collegate a questo fenomeno? La Data Discovery è importantissima nell’aiutare i responsabili delle decisioni a rilevare i primi segnali di insoddisfazione dei clienti e a comprendere con maggiore dettaglio come i clienti vedono l’azienda.
  • Customer service and support efficiency
    • I problemi segnalati dai clienti sono gestiti in modo efficiente dal servizio di assistenza? Che legame c’è tra la soddisfazione del cliente e la veloce e corretta risoluzione dei ticket aperti? L’analisi del testo, dell’umore, dei social e delle varie discussioni può essere utilizzata per identificare ciò che i clienti dicono sull’azienda attraverso le interazioni tra loro e con i contact center. Un’analisi del sentiment e delle emozioni dei clienti possono aiutare i leader aziendali a individuare dove i potenziali problemi di prodotti o servizi possono essere collegabili con un vasto numero di clienti.
  • Marketing strategies
    • Quali sono gli sconti giusti da applicare nei diversi segmenti del mercato? Sconti eccessivi fanno perdere valore al mio prodotto?
  • Promotional campaign
    • Quali promozioni particolari possono aiutare ad attrarre con il massimo beneficio nuovi clienti? Quali sono le necessità che c’è bisogno di soddisfare? Gli strumenti di Data Discovery offrono diverse opportunità per imparare di più sui loro clienti e agire su queste idee. Per esempio, possono aiutare a determinare quali prodotti sta usando un particolare cliente e poi stabilire se possa essere un buon candidato per un’offerta specifica.
  • Competitor analysis
    • Cosa riesco a scoprire dal confronto con le aziende che operano nello stesso settore? Quali sono le differenze che possono avermi portato a un guadagno o a una perdita?

In conclusione possiamo dire che il processo di Data Discovery è ormai fondamentale in tutte le aziende che vogliono ricavare dai dati il massimo del valore che è nascosto in essi, semplificando in modo molto vantaggioso il processo di esplorazione e scoperta delle strutture non esplicitamente visibili nelle immense raccolte di dati che caratterizzano i Big Data.