linguistica computazionale per la traduzione

SCHEDA PROGRAMMA 2014-2015
Nome dell’insegnamento:
Linguistica computazionale
SSD di riferimento:
INF/01
Numero di CFU:
8 CFU
Durata e periodo di
svolgimento:
Corso semestrale – II semestre – 60 ore
Gruppo destinatario:
I annualità - Corso di laurea magistrale
Docente responsabile:
Altri docenti:
Articolazione didattica:
Titolo del corso:
Obiettivi:
Prerequisiti:
modulo unico
Strumenti e metodologie per l’elaborazione automatica delle lingue naturali.
Il corso ha i seguenti obiettivi:
a) fornire agli studenti le nozioni fondamentali di informatica relative alla gestione ed
elaborazione automatica delle lingue naturali (NLP – Natural Language Processing);
b) avviare gli studenti alla comprensione dei vari possibili utilizzi dell’elaborazione
digitale dei dati linguistici;
c) fornire agli studenti gli strumenti necessari per consentire loro una gestione dell’intero
processo di elaborazione di dati linguistici in formato elettronico in completa autonomia.
Alla fine del corso gli studenti devono avere acquisito la capacità di sviluppare algoritmi
basati sull’impiego di “espressioni regolari”.
Il corso si rivolge a studenti che abbiano già una conoscenza di base dell’informatica.
Sono requisiti fondamentali:
a) una buona conoscenza delle funzioni basilari del sistema operativo;
b) una qualche esperienza di studio di almeno una lingua straniera;
c) la conoscenza dei vari livelli di analisi linguistica e del relativo metalinguaggio.
Contenuti / argomenti
affrontati:
La gestione dei dati linguistici in chiave digitale. Il corso dedica particolare attenzione alla
gestione elettronica dei dati testuali, alla codifica dei caratteri e agli strumenti informatici
utili per garantire una corretta elaborazione automatica delle informazioni relativamente
alla varietà di utilizzo: dalla Traduzione Automatica alla Linguistica dei Corpora.
Modalità di svolgimento:
Il corso è articolato in due livelli di attività strettamente correlate tra loro:
a) apprendimento delle nozioni teoriche di base indispensabili per la corretta
comprensione delle problematiche inerenti la gestione ed elaborazione digitale di dati
linguistici;
b) apprendimento pratico di un linguaggio di programmazione utile per lo scopo indicato.
Entrambe le parti sono da considerare funzionali e non sono alternative. La seconda, in
particolare, presuppone la buona comprensione di quanto svolto nella prima.
Modalità di esame:
Eventuale valutazione in
itinere:
Criteri di valutazione:
Prova orale: presentazione e descrizione di un’attività pratica di progetto.
“Non prevista.”
- Conoscenza degli aspetti teorici e pratici relativi all’elaborazione delle lingue naturali.
- Capacità di elaborare analisi e soluzioni concrete in termini di progetto.
08.10.2014
Testi di esame:
Programma per non
frequentanti:
Altro:
Gawk: Effective AWK Programming (https://www.gnu.org/software/gawk/manual/)
Beri Marco. Espressioni regolari. Apogeo (collana Pocket), 2007
Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli. Testo e computer. Elementi di
linguistica computazionale. Carocci, 2005
Maria Freddi. Linguistica dei corpora. Carocci (collana Bussole), 2014
Data la natura teorico-pratica del corso, è vivamente consigliata la frequenza.
08.10.2014