Come ci immaginiamo il futuro della Data Science

Forse è un po’ presto per domandarsi del futuro della Data Science, soprattutto in Italia dove in molte aziende ancora stenta a farsi strada, se non in una una forma di investimento ‘a perdere’, poco legato ai processi ‘core’. Si parla già del nuovo inverno dell’Intelligenza Artificiale, come quelli catastrofici degli anni 80’ e poi inizio dei 90’. A noi pare prematuro, perché pensiamo ci sia ancora molto da fare e da sviluppare.

Notiamo comunque una differenza col passato che a nostro avviso è determinante. I modelli e le tecniche del passato erano molto legate a discorsi accademici e molto poco orientate alle applicazioni, che pure non sono mancate. Oggi, con tutti gli avanzamenti del Deep Learning, dei Transformer (vedi il fenomeno GPT-3 di openai.com) e dei chatbot, c’è davanti a noi una prateria di applicazioni tutte da scoprire e implementare.

La ricerca di punta nell’AI potrà pure andare presto in letargo (ancora bisogna vedere), ma il fronte applicativo, quello che interessa le aziende è un libro quasi completamente da scrivere, siamo solo agli inizi.

Ma proviamo comunque a fare uno sforzo d’immaginazione. Proviamo a dipingere degli scenari plausibili a partire da cosa si intravede oggi, nell’attuale panorama dell’AI.

Un filone chiaramente in grande espansione è quello della generazione automatica di tesi. Prima abbiamo citato GPT-3 che ha fatto eco nelle news, ma ora la scelta si sta ulteriormente ampliando. Proviamo a dire una parola in più su questi modelli, detti anche Transformer. Spiegato in parole semplici sono dei sistemi che alimentandosi da ampi corpus testuali, parliamo di 45TB (un TB equivale a circa 1000 miliardi di byte) di testi provenienti da fonti eterogenee costruiscono una macchina tarata su 175B di parametri! È un modello base dal quale si può partire per costruire anche qualcosa di personalizzato.

È come se aveste un modello linguistico base che potete adattare al vostro stile o a uno specifico campo di applicazione. Gli utilizzi sono i più svariati: sentiment analysis, generazione di domande/risposte, traduzioni, sommarizzazione e classificazione testi, per citare i più rilevanti. Non sono attività recenti di cui si è occupata l’informatica, ma la novità è che funzionano! Funzionano a tal punto che stentate a distinguere un testo generato da GPT-3 rispetto a un originale prodotto da un umano. La qualità e l’efficienza nella produzione hanno fatto un salto di qualità enorme.

Siamo sicuramente lontani da un’idea di Intelligenza Artificiale Generale, che sia paragonabile all’intelligenza umana in tutta la sua complessità e adattabilità alle diverse situazioni. Ma nella sua versione ‘narrow’, su compiti specifici, diventa estremamente efficace, e non solo quindi per la velocità d’esecuzione, come ci si aspetta da un computer, ma anche nella qualità del risultato.

Pensate alla generazione di testi in ambito marketing e comunicazione, messaggi per gli ads, DEM e così via. Già oggi vedete con Google Compose su GMail che quando scrivete una email il sistema vi suggerisce intere frasi, non solo parole come nelle tastiere virtuali dei nostri smartphone.

Immaginate ora per estensione che il sistema completi un’intera email per voi e che magari la adatti al mittente. È come se avessimo un livello di automatizzazione non solo nei compiti ripetitivi come nel modello industriale classico, ma anche in compiti creativi. Questa è la grande differenza col passato. Partendo dalla conoscenza che le macchine stanno facendo di noi, riescono a raggiungere un grado di creatività selettivo e verticalizzato che può essere credibile e applicabile in vari contesti di business.

Stesso discorso per le immagini e video. La capacità di riconoscimento selettivo, anche con librerie software di pubblico dominio, è a uno stadio avanzatissimo (si veda questo trailer su Yolo: https://www.youtube.com/watch?v=VOC3huqHrss).

Qui le applicazioni sono solo limitate dalla fantasia. Per tutti i casi citati non esiste una soluzione omnicomprensiva che sia adattabile alle varie situazioni aziendali, eccetto alcuni casi di qualche vendor specializzato. In tutti i casi, allo stato attuale, c’è bisogno di progetti ad hoc, che partendo dalle tecnologie disponibili costruiscono la soluzione. Rispetto ad altri mercati maturi dell’IT è evidente che siamo ancora in una fase pionieristica, quasi di verifica sul campo e la strada da fare per una vera maturazione del settore è ancora lunga. Quindi, potremmo concludere estremizzando il concetto: il futuro per la Data Science nelle applicazioni business è oggi!

Approfondisci con Alessandro Chessa CEO Linkalab