Introduzione all'informatica umanistica (2019/2020)

Codice insegnamento
4S008106
Docente
Marco Rospocher
Coordinatore
Marco Rospocher
crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
I semestre (Lingue e letterature straniere) dal 30-set-2019 al 11-gen-2020.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi

Il corso si propone di presentare agli studenti gli strumenti e le discipline su cui si basa l'Informatica Umanistica, in particolare per quel che riguarda le edizioni scientifiche digitali e l’analisi computazionale di testi. Al termine del corso gli studenti: - conosceranno le principali fasi di realizzazione di un’edizione scientifica digitale, e acquisiranno le abilità pratiche per realizzare la codifica di testi di ambito umanistico; - conosceranno le principali attività per l’elaborazione automatica del testo scritto, e saranno in grado di utilizzare alcuni dei principali strumenti che le supportano; - conosceranno le principali metodologie e strumenti per l’analisi computazionale di testi, e saranno in grado di applicarle ad esempi testuali da analizzare.

Programma

Introduzione alle Digital Humanities
Fondamenti di Informatica: teoria dell'informazione, algoritmi e linguaggi, architettura di un eleboratore
Internet & Web
Creazione di pagine web: HTML & CSS
Il metalinguaggio XML
Informatica umanistica e filologia: l’edizione scientifica digitale [Dr. Anna Cappellotto]
TEI e codifica dei testi
OCR: Riconoscimento ottico dei caratteri [Dr. Stefano Bazzaco]
RegEx: Espressioni regolari e loro utilizzo
Natural Language Processing: l'elaborazione del linguaggio naturale
Distant reading: introduzione e uso di Voyant
Distant Reading con Sentiment Analysis [Dr. Simone Rebora]
Stilometria [Dr. Simone Rebora]

Materiali e risorse saranno forniti durante il corso come supporto alle lezioni, e caricati sulla pagina Moodle del corso.
In aggiunta al libro di testo suggerito, si consigliano come materiali integrativi le seguenti risorse:

- Argomento: Informatica umanistica e filologia: l’edizione scientifica digitale)

Patrick Sahle, “What is a Scholarly Digital Edition?”, in E. Pierazzo & M. Driscoll (eds), Digital Scholarly Editing: Theories and Practices, Open Book Publishers 2016, pp. 19-40
URL: https://www.openbookpublishers.com/htmlreader/978-1-78374-238-7/ch2.xhtml

- Argomento: TEI e codifica dei testi

Video corso ad accesso libero "Digital Scholarly Editions" sulla piattaforma #dariahTeach
URL: https://teach.dariah.eu/course/view.php?id=32

- Argomento: OCR: Riconoscimento ottico dei caratteri

David A. Smith, Ryan Cordell, A Research Agenda for Historical and Multilingual Optical Character Recognition, NULab – Northeastern University, 2018
URL: https://repository.library.northeastern.edu/downloads/neu:m043p093w?datastream_id=content

- Argomento: Topic modelling e Stilometria

Fabio Ciotti. 2017. “Modelli e metodi computazionali per la critica letteraria: lo stato dell’arte.” In B. Alfonzetti, T. Cancro, V. Di Iasio, E. Pietrobon (a cura di). L’Italianistica oggi: ricerca e didattica. Roma: Adi editore, pp. 1-11.
URL: http://www.italianisti.it/upload/userfiles/files/Ciotti.pdf


Per chi è interessato ad approfondire ulteriormente le tematiche del corso, si consiglia anche il libro:

INFORMATICA UMANISTICA 2/ED
Marco Lazzari
McGraw-Hill, 2014
ISBN: 9788838668555
https://univr.primo.exlibrisgroup.com/discovery/fulldisplay?docid=alma990003784900205791&context=L&vid=39UVR_INST:39UVR_VU1&search_scope=Aleph_SP&tab=Aleph_slot&lang=it

Testi di riferimento
Autore Titolo Casa editrice Anno ISBN Note
Francesca Tomasi Metodologie informatiche e discipline umanistiche (Edizione 1) Carocci 2008 9788843043033

Modalità d'esame

La frequenza al corso è vivamente consigliata.
La prova d'esame è scritta.

Non c'è differenza di programma, materiali ed esame tra frequentanti e non frequentanti