Anno Accademico: 2010-2011
:: Ricerca ::
Titolatura
Docente
Settore disciplinare
Corso di laurea
Iscrizione on line Appelli d'esame Avvisi
:: Insegnamento :: Linguistica computazionale
Titolatura Linguistica computazionale
CDS Informatica Umanistica (DM 270)
Docenti Alessandro Lenci
Pagina webhttp://moodle.humnet.unipi.it/
Anno(i) di frequenzaII
Tipo di insegnamento Corso
Codici/crediti Modulo unico:305LL cfu:12
Settore scientifico - disciplinare L-LIN/01 Glottologia e linguistica
Periodo lezioniPrimo semestre
OrarioPrimo semestre Lunedì 10:0-12:0 FIB-L Aula L- Polo didattico via Buonarroti
Primo semestre Martedì 10:0-12:0 FIB-L Aula L- Polo didattico via Buonarroti
Primo semestre Mercoledì 10:0-12:0 FIB-M Laboratorio M - Polo didattico via Buonarroti
Primo semestre Giovedì 8:30-10:0 FIB-M Laboratorio M - Polo didattico via Buonarroti
Commissione: MembriFelice Dell'Orletta, Saverio Sani
Commissione: SupplentiGiovanna Marotta
Titolo - modulo A o unicoLinguistica computazionale
Argomento: Modulo AIl corso ha lo scopo di presentare i temi principali della linguistica computazionale e del “Natural Language Processing” (NLP) e di familiarizzare lo studente con gli strumenti di base per l’analisi quantitativa e computazionale del testo.

Prima parte - Analisi computazionale dei dati linguistici
Lezioni Teoriche:
- i dati della lingua
- corpora: tipologia e uso
- codifica e rappresentazione dei dati linguistici
- corpora annotati
- analisi statisitica dei dati linguistici
- linguaggio e probabilità
- metodi computazionali per l'esplorazione dei dati linguistici: concordanze, collocazioni e misure di associazione

Esercitazioni:
- introduzione a NLTK
- XML per la codifica dei dati linguistici
- espressioni regolari


Seconda parte - il trattamento automatico della lingua

Lezioni Teoriche:
- il processo dell'annotazione linguistica
- automi e Trasduttori a Stati Finiti. Modelli computazionali dell'analisi morfologica
- (Dott. Dell'Orletta) l'annotazione linguistica come un problema di classificazione e cenni di metodi di machine learning:
- analisi morfo-sintattica, il Part of Speech Tagging
- metodi di valutazione
- algoritmi a regole e di machine learning
- metodi utilizzati e risultati raggiunti nello stato dell'arte
- grammatiche Context Free
- (Dott. Dell'Orletta) metodi computazionali per l'analisi sintattica
- chunking e shallow parsing
- cenni di parsing a costituenti
- parsing a dipendenze
- metodi di valutazione
- metodi utilizzati e risultati raggiunti nello stato dell'arte
- la rappresentazione computazionale del significato: Wordnet e FrameNet

Esercitazioni:
- sviluppo di un sistema ibrido di annotazione linguistica del testo utilizzando NLTK:
- sviluppo di sistemi a regole
- utilizzo di algoritmi di apprendimento automatico
Testi: Modulo A- A. Lenci, S. Montemagni, V. Pirrelli, Testo e computer. Elementi di
linguistica computazionale, Carocci, 2005
- D. Jurafsky & J.H. Martin, Speech and Language Processing, Prentice
Hall, 2000 (capp. 1, 2, 3, 8.1-8.4, 8.6, 9, 10.1-10.3, 16)
- Bird, S., Klein, E., & E. Loper, Natural Language Processing with Python (Analyzing Text with the Natural Language Toolkit), O'Reilly Media, 2009. (http://www.nltk.org/book)


Programma: Vecchio ordinamentoPrima parte - Analisi computazionale dei dati linguistici
Lezioni Teoriche:
- i dati della lingua
- corpora: tipologia e uso
- codifica e rappresentazione dei dati linguistici
- corpora annotati
- analisi statisitica dei dati linguistici
- linguaggio e probabilità
- metodi computazionali per l'esplorazione dei dati linguistici: concordanze, collocazioni e misure di associazione

Esercitazioni:
- introduzione a NLTK
- XML per la codifica dei dati linguistici
- espressioni regolari


Seconda parte - il trattamento automatico della lingua

Lezioni Teoriche:
- il processo dell'annotazione linguistica
- automi e Trasduttori a Stati Finiti. Modelli computazionali dell'analisi morfologica
- (Dott. Dell'Orletta) l'annotazione linguistica come un problema di classificazione e cenni di metodi di machine learning:
- analisi morfo-sintattica, il Part of Speech Tagging
- metodi di valutazione
- algoritmi a regole e di machine learning
- metodi utilizzati e risultati raggiunti nello stato dell'arte
- grammatiche Context Free
- la rappresentazione computazionale del significato: Wordnet e FrameNet

Esercitazioni:
- sviluppo di un sistema ibrido di annotazione linguistica del testo utilizzando NLTK:
- sviluppo di sistemi a regole
- utilizzo di algoritmi di apprendimento automatico
Testi: Vecchio ordinamento- A. Lenci, S. Montemagni, V. Pirrelli, Testo e computer. Elementi di
linguistica computazionale, Carocci, 2005
- D. Jurafsky & J.H. Martin, Speech and Language Processing, Prentice
Hall, 2000 (capp. 1, 2, 3, 8.1-8.4, 8.6, 9, 10.1-10.3, 16)
Eventuali indicazioni per non frequentantiSi invitano gli studenti che intendano sostenere l'esame come non frequentanti a contattare per tempo il docente per l'assegnazione di eventuali letture aggiuntive
Modalità d'esameEsame scritto + progetto

L'esame scritto, diviso in due prove, può essere sostenuto o come compiti in itinere durante il corso oppure in occasione degli appelli scritti. Le prove in itinere possono essere utilizzate SOLO dagli studenti frequentanti.

Il progetto viene presentato e discusso in occasione degli appelli orali. Il superamento dell'esame scritto è condizione strettamente necessaria per presentarsi all'orale e discutere il progetto.
Prossimi appelli Da settembre 2014 le iscrizioni si raccolgono dal portale esami di ateneo

Ultimo aggiornamento: 5/4/2011


Home Altri anni accademici Operatori Docenti
Tutte le informazioni contenute in questo sito sono a disposizione del pubblico solo per uso privato. E' espressamente vietata la riproduzione totale o parziale a fini commerciali di testi e immagini qui pubblicati.