Il corso si propone di presentare agli studenti gli strumenti e le discipline su cui si basa l'Informatica Umanistica, in particolare per quel che riguarda le edizioni scientifiche digitali e l’analisi computazionale di testi. Al termine del corso gli studenti: - conosceranno le principali fasi di realizzazione di un’edizione scientifica digitale, e acquisiranno le abilità pratiche per realizzare la codifica di testi di ambito umanistico; - conosceranno le principali attività per l’elaborazione automatica del testo scritto, e saranno in grado di utilizzare alcuni dei principali strumenti che le supportano; - conosceranno le principali metodologie e strumenti per l’analisi computazionale di testi, e saranno in grado di applicarle ad esempi testuali da analizzare.
Introduzione alle Digital Humanities
Fondamenti di Informatica: teoria dell'informazione, algoritmi e linguaggi, architettura di un eleboratore
Internet & Web
Creazione di pagine web: HTML & CSS
Il metalinguaggio XML
Informatica umanistica e filologia: l’edizione scientifica digitale [Dr. Anna Cappellotto]
TEI e codifica dei testi
OCR: Riconoscimento ottico dei caratteri [Dr. Stefano Bazzaco]
RegEx: Espressioni regolari e loro utilizzo
Natural Language Processing: l'elaborazione del linguaggio naturale
Distant reading: introduzione e uso di Voyant
Distant Reading con Sentiment Analysis [Dr. Simone Rebora]
Stilometria [Dr. Simone Rebora]
Materiali e risorse saranno forniti durante il corso come supporto alle lezioni, e caricati sulla pagina Moodle del corso.
In aggiunta al libro di testo suggerito, si consigliano come materiali integrativi le seguenti risorse:
- Argomento: Informatica umanistica e filologia: l’edizione scientifica digitale)
Patrick Sahle, “What is a Scholarly Digital Edition?”, in E. Pierazzo & M. Driscoll (eds), Digital Scholarly Editing: Theories and Practices, Open Book Publishers 2016, pp. 19-40
URL: https://www.openbookpublishers.com/htmlreader/978-1-78374-238-7/ch2.xhtml
- Argomento: TEI e codifica dei testi
Video corso ad accesso libero "Digital Scholarly Editions" sulla piattaforma #dariahTeach
URL: https://teach.dariah.eu/course/view.php?id=32
- Argomento: OCR: Riconoscimento ottico dei caratteri
David A. Smith, Ryan Cordell, A Research Agenda for Historical and Multilingual Optical Character Recognition, NULab – Northeastern University, 2018
URL: https://repository.library.northeastern.edu/downloads/neu:m043p093w?datastream_id=content
- Argomento: Topic modelling e Stilometria
Fabio Ciotti. 2017. “Modelli e metodi computazionali per la critica letteraria: lo stato dell’arte.” In B. Alfonzetti, T. Cancro, V. Di Iasio, E. Pietrobon (a cura di). L’Italianistica oggi: ricerca e didattica. Roma: Adi editore, pp. 1-11.
URL: http://www.italianisti.it/upload/userfiles/files/Ciotti.pdf
Per chi è interessato ad approfondire ulteriormente le tematiche del corso, si consiglia anche il libro:
INFORMATICA UMANISTICA 2/ED
Marco Lazzari
McGraw-Hill, 2014
ISBN: 9788838668555
https://univr.primo.exlibrisgroup.com/discovery/fulldisplay?docid=alma990003784900205791&context=L&vid=39UVR_INST:39UVR_VU1&search_scope=Aleph_SP&tab=Aleph_slot&lang=it
Autore | Titolo | Casa editrice | Anno | ISBN | Note |
Francesca Tomasi | Metodologie informatiche e discipline umanistiche (Edizione 1) | Carocci | 2008 | 9788843043033 |
La frequenza al corso è vivamente consigliata.
Non c'è differenza di programma, materiali ed esame tra frequentanti e non frequentanti
AGGIORNAMENTO: La prova d'esame verrà somministrata tramite un quiz Moodle, da svolgere in aula informatizzata il giorno dell'appello. Si prega di prendere visione del documento "Modalità d'esame" caricato nella home-page del corso su Moodle.
******** CSS e script comuni siti DOL - frase 9957 ********