In questo articolo:
Tuttavia in pochi sanno veramente cosa significhi; come possa essere messa al nostro servizio per semplificare le attività quotidiane poi, è un mistero. Immaginatevi quanti possano sapere come il Natural Language Processing può essere implementato all’interno di un’azienda, in quali processi e con quali benefici!
Noi di Awhy abbiamo deciso quindi di scrivere di tanto in tanto qualche approfondimento in materia. Partendo da testi e pubblicazioni accademiche, il nostro obiettivo è quello di rendere accessibile gran parte di questi concetti anche a chi non proviene da un background tipicamente IT.
Cerchiamo di rendere un elaboratore elettronico capace di leggere ed interpretare il linguaggio umano. I primi studi risalgono agli anni 50’. Le possibilità di applicazione si sono moltiplicate esponenzialmente, principalmente a causa di due fattori: l’evoluzione hardware e la mole di dati reperibile online.
Per quanto riguarda l’hardware è semplice: capacità computazionali maggiori permettono di elaborare più informazioni in meno tempo.
Le informazioni sono presenti in quantità ridondante e sono non-strutturate: pensate per la fruizione umana e non per essere date in pasto ad elaboratori elettronici. Il muro da scavalcare è quindi rendere un computer capace di strutturare questi dati, riuscendo a carpirne il senso e le finalità.
Per lungo tempo gli algoritmi che si occupavano di individuare, aggregare e processare le informazioni si sono basati sulla sola rappresentazione testuale di pagine web: ricerca del testo, divisione dello stesso, conteggio del numero di parole. Tutti questi passaggi si rivelano abbastanza inutili quando parliamo di interpretare informazioni.
Quali sono le aree e/o le attività necessarie per comprendere un blocco di testo? Vediamole insieme:
Quello che cerca di dirci è che mentre parliamo il nostro cervello interpreta, compara e analizza: il significato semantico della parola, l’ambiente circostante, l’espressività e la gestualità. Infine vanno considerati tutti gli episodi rilevanti della nostra vita che aiutano a contestualizzare ciò di cui stiamo parlando.
Ed è proprio qui che risiede la sfida del Natural Language Processing: gli elaboratori non hanno la capacità di contestualizzazione e di interpretazione.
Per fare ciò fanno leva su particolarità semantiche che non sono espresse nel testo.
L’approccio combina discipline tradizionali con quelle più recenti: affinché questi modelli computazionali siano in grado, un giorno, di riprodurre con esattezza il processo linguistico, è necessaria la collaborazione di neuro-scienziati, psicolinguisti, antropologi, informatici e filosofi.
Possiamo solo procedere con un approccio squisitamente scientifico: ipotesi, test, verifica dei risultati. Solo così facendo gli algoritmi potranno migliorare di volta in volta in un processo continuo.
Speriamo di non avervi stancato troppo! Nel prossimo articolo della rubrica ripercorreremo un po’ di storia del Natural Language Processing, cercando di capire come la disciplina si sia evoluta nel corso degli anni, sia a livello funzionale che a livello tecnico.
Ricordatevi di seguirci sulle nostre pagine Facebook, LinkedIn e Twitter e qui sul nostro blog per rimanere sempre aggiornati sugli ultimi articoli ??
Emanuele