Natural Language Processing (NLP) for analyzing written textual resources + Semantic Web and Linked Data technologies for the humanities (2020/2021)

Corso a esaurimento (attivi gli anni successivi al primo)

Codice insegnamento
cod wi: DT000040
Docente
Marco Rospocher
Coordinatore
Marco Rospocher
crediti
2
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Sede
VERONA
Periodo
A.A. 20/21 dottorato dal 1-ott-2020 al 30-set-2021.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi


Per le informazioni dettagliate sul corso, si consulti:
https://moodle.univr.it/moodleext/course/view.php?id=191

Al termine di questo corso, gli studenti dovrebbero essere in grado di:
• Comprendere i concetti e i task di base dell'elaborazione del linguaggio naturale (NLP), in particolare per l'analisi delle risorse testuali scritte
• Comprendere i principi di modellizzazione, la logica e i possibili usi di popolari risorse linguistiche (ad es. WordNet) utilizzate nelle applicazioni NLP
• Comprendere i concetti e le tecnologie di base dietro Semantic Web, Linked Data e Knowledge Graphs
• Interrogare il contenuto dei repository Semantic Web per ispezionare e accedere al loro contenuto
• Comprendere i principi di modellizzazione, la logica e i possibili usi delle risorse Semantic Web popolari (ad es. DBpedia)

Programma

La parte principale della lezione sarà dedicata a presentare e discutere gli strumenti, le tecniche e le risorse utilizzate in NLP per l'analisi delle risorse testuali scritte, e nel Semantic Web, mentre la parte rimanente sarà una sessione pratica con alcuni di essi.
Il corso coprirà:
• Risorse per l'elaborazione del linguaggio naturale (NLP): WordNet, ecc.
• Attività di elaborazione del linguaggio naturale (NLP), quali tokenizzazione, codifica di parti del discorso, codifica delle dipendenze, disambiguazione del senso delle parole, riconoscimento e classificazione delle entità nominali, risoluzione delle coreferenze, collegamento delle entità, etichettatura dei ruoli semantici
• Strumenti di analisi del testo, come Voyant
• Tecnologie del Semantic Web e dei Linked Oen Data: RDF, OWL, SPARQL
• Risorse del Semantic Web e dei Linked Oen Data: cloud LOD, DBpedia, ecc.

Testi di riferimento
Autore Titolo Casa editrice Anno ISBN Note
Francesca Tomasi Metodologie informatiche e discipline umanistiche (Edizione 1) Carocci 2008 9788843043033

Modalità d'esame

Non previsto