Acquista:

prezzo di copertina € 26,00

a stampa € 24,70

collana "Itinerari"

pp. 240, Brossura, 978-88-15-29035-9
anno di pubblicazione 2023

disponibile su Pandoracampus

ELISABETTA JEZEK, RACHELE SPRUGNOLI

Linguistica computazionale

Introduzione all'analisi automatica dei testi

Dopo aver fornito i cenni storici sulla disciplina, il libro introduce le nozioni di linguistica e statistica necessarie per il trattamento automatico del linguaggio. Sono affrontati poi nell’ordine: i metodi e le tecniche di apprendimento automatico (machine learning) tradizionale e con reti neurali, le rappresentazioni vettoriali del significato delle parole, l’annotazione di dati linguistici a scopi computazionali e i diversi task di Natural Language Processing: da quelli di pre-processing a quelli di classificazione e di generazione di testi. Conclude il volume un capitolo che fornisce informazioni su dove trovare gli strumenti utili per effettuare l’analisi automatica dei testi.

Indice del volume: Premessa. - I. Definizione, scopi e cenni storici. - II. Basi di linguistica. - III. Basi di statistica. - IV. Apprendimento automatico. - V. Semantica distribuzionale e tipi di vettori. - VI. L’annotazione dei testi. - VII. Task di Natural Language Processing. - VIII. Strumenti per l’analisi dei testi. - Riferimenti bibliografici. - Sitografia. - Indice analitico.

Elisabetta Jezek insegna Linguistica computazionale nell’Università di Pavia. Con il Mulino ha pubblicato anche «Lessico. Classi di parole, strutture, combinazioni» (nuova ed. 2011). Rachele Sprugnoli insegna Informatica umanistica nell’Università di Parma.

Premessa

I. Definizione, scopi e cenni storici

1. Introduzione

2. Studiare le lingue e il linguaggio con metodi computazionali

3. Il Natural Language Processing

4. Visione integrata di linguistica computazionale e Natural Language Processing

5. Rapporti con l’intelligenza artificiale

6. Che cosa è un modello computazionale?

7. Cenni storici

8. La comunità della linguistica computazionale

■ QUADRO 1.1. Le campagne di valutazione

II. Basi di linguistica

1. Tipi di parole

2. Combinazioni di parole: le collocazioni

3. Semantica lessicale, ambiguità e polisemia

4. Relazioni semantiche tra parole

5. Classi di parole e parti del discorso

6. Sintassi e semantica delle frasi

7. Tipi di eventi e classi di verbi

8. Dire, implicare, presupporre: la pragmatica

9. Testo, discorso e relazioni discorsive

III. Basi di statistica

1. Statistica e linguaggio

2. Frequenze e distribuzioni

3. Misure di associazione

4. Misure di similarità

5. Coefficienti di correlazione

6. Il concetto di probabilità

7. Significatività statistica

IV. Apprendimento automatico

1. Che cos’è l’apprendimento automatico?

2. Metodi di apprendimento automatico

3. Apprendimento automatico tradizionale

3.1. Regressione lineare e logistica

3.2. Macchine a vettori di supporto

3.3. Modelli del linguaggio tradizionali

3.4. Tipi di clustering e algoritmo K-means

4. Apprendimento automatico con reti neurali

4.1. Reti neurali feedforward

4.2. Reti neurali ricorrenti

4.3. Reti neurali transformers

4.4. Modelli neurali del linguaggio

5. Valutazione dei modelli computazionali

5.1. Suddivisione dei dati e cross-validation

5.2. Metriche di valutazione

V. Semantica distribuzionale e tipi di vettori

1. L’ipotesi distribuzionale

2. Rappresentare il significato delle parole con i vettori

3. Caratteristiche dei vettori e operazioni

4. Tipi di vettori

4.1. Costruire gli embeddings

4.2. Embeddings contestuali

5. Valutazione dei tipi di vettori

■ QUADRO 5.1. Questioni sociali ed etiche

VI. L’annotazione dei testi

1. Introduzione

2. Livelli di annotazione

2.1. Lessico

2.2. Morfologia

2.3. Sintassi

2.4. Semantica

2.5. Pragmatica

2.6. Testo

2.7. Altre annotazioni

3. Standard e formati

4. Accordo tra annotatori

5. Strumenti per l’annotazione manuale

6. Crowdsourcing

6.1. Crowdsourcing con micro-task

6.2. Giochi con uno scopo

■ QUADRO 6.1. Questioni legali

VII. Task di Natural Language Processing

1. Introduzione

2. Task di pre-processing

3. Task di classificazione

3.1. Identificazione delle parti del discorso

3.2. Lemmatizzazione

3.3. Analisi sintattica automatica

3.4. Riconoscimento delle entità nominate

3.5. Elaborazione dell’informazione temporale

3.6. Risoluzione di coreferenza e anafora

3.7. Disambiguazione del senso delle parole

3.8. Assegnazione dei ruoli semantici

3.9. Classificazione degli atti dialogici

3.10. Analisi del sentiment

3.11. Riconoscimento dei discorsi d’odio

3.12. Riconoscimento dell’ironia

3.13. Identificazione di notizie false

3.14. Analisi dell’autorialità

4. Task di generazione

4.1. Traduzione automatica

4.2. Generazione di risposte

4.3. Generazione di riassunti

■ QUADRO 7.1. Natural Language Processing e Digital Humanities

VIII. Strumenti per l’analisi dei testi

1. Dove trovare ciò che serve

2. Pipelines

3. Demo online

4. Librerie

5. Servizi cloud

6. Strumenti per la valutazione

7. Strumenti per l’esplorazione e l’analisi di corpora

8. Strumenti per l’analisi statistica

Riferimenti bibliografici

Sitografia

Indice analitico

Acquista:

ELISABETTA JEZEK, RACHELE SPRUGNOLI

Linguistica computazionale

Introduzione all'analisi automatica dei testi

Leggi anche