L'esperienza di Alta Formazione al CNR ISPC

Aprile 2022

Dalle Marche a Vienna: un progetto di Machine Learning per lo studio della ceramica

Un lungo lavoro di ricerca bibliografica, iniziato nel novembre del 2019, ha caratterizzato la prima fase del mio progetto per la a creazione di un grande database di profili vascolari e informazioni archeologiche. Ad oggi, la schedatura è pressoché conclusa e il dataset include circa 25.000 profili vascolari provenienti da 700 contesti diversi, che vanno dal Bronzo Antico all’Età Arcaica.

La mia tesi di dottorato, svolta all’interno del corso in Patrimoni archeologici, storici, architettonici e paesaggistici mediterranei (PASAP) promosso dall’Università degli Studi di Bari Aldo Moro, dall’Istituto di Scienze del Patrimonio Culturale del CNR e dal Politecnico di Bari, è intitolata “Variabilità e standardizzazione delle forme vascolari nel II e prima metà del I millennio in Italia continentale. Metodi di unsupervised learning per lo studio quantitativo dei profili della ceramica archeologica”. Il progetto è seguito, in qualità di tutor, dal dott. Marco Bettelli, dirigente di ricerca del CNR ISPC, e in qualità di co-tutores, dal prof. Andrea Cardarelli della Sapienza Università di Roma e dalla dott.sa Paola Moscati, dirigente di ricerca del CNR ISPC.

I presupposti della tematica sono maturati all’interno delle attività di scavo e di studio dell’insediamento protostorico del Monte Croce Guardia di Arcevia, nelle Marche, in provincia di Ancona, sotto la direzione scientifica del prof. Cardarelli e la collaborazione del dott. Bettelli e del dott. Andrea Di Renzoni, ricercatore del CNR ISPC.

In principio, il progetto era stato pensato per rispondere ad una problematica molto specifica: come standardizzare la produzione ceramica nella Protostoria dell’Italia continentale, utilizzando le metodologie quantitative applicate nello studio delle immagini, ben note nel mondo della Data Science e del Machine Learning?

Durante la fase preliminare, mi sono reso conto che lo studio della standardizzazione fosse solo uno degli aspetti che possono essere indagati attraverso questo approccio. Durante il corso del dottorato, i vari metodi ideati hanno cominciato ad essere formalizzati e trasformati in funzioni riproducibili e riapplicabili. Nasce così la volontà di rendere fruibile questa metodologia, attraverso la creazione di una libreria, chiamata AIPPA, acronimo di Ancient Italy Pottery Profile Analysis. Coerentemente con la filosofia del linguaggio di programmazione utilizzato, Python, che si configura come il linguaggio open source per eccellenza, Il pacchetto, con le sue tecniche e i suoi metodi, sarà liberamente utilizzabile alla fine del progetto.

La libreria ideata per lo studio di profili vascolari di ogni epoca e tipo, include strumenti di preprocessing e di gestione delle informazioni archeologiche associate ad ogni reperto vascolare. Grazie ad algoritmi di features extraction è possibile quantificare il profilo del vaso, rendendolo di fatto analizzabile come dataset multivariato.

Gli strumenti di analisi dei profili sono mediati dal mondo della statistica e della Data Science: includono diversi algoritmi di features extraction, dimensionality reduction e clustering. Inoltre, non sono stati esclusi approcci legati al mondo del Machine Learning e dell’Intelligenza Artificiale come Convolutional Neural Networks, Autoencoders, e Generative Adversial Networks. Grande spazio è infine riservato alla visualizzazione dei dati, anche attraverso grafici interattivi. La libreria, al momento in fase di sviluppo, verrà costantemente aggiornata con nuove tecniche e metodi.

La versatilità del metodo, applicabile ad una grande varietà di contesti, ha permesso di entrare in contatto con diversi progetti di ricerca: come, ad esempio, quelli di Arslantepe ed Efeso. Il materiale ceramico proveniente da questi contesti verrà indagato durante un periodo di soggiorno come guest researcher presso Österreichisches Archäologisches Institut di Vienna, con la supervisione della dott.ssa Pamela Fragnoli, in accordo con gli obiettivi di formazione del mio percorso di dottorato.

Tutt’ora in corso è la partecipazione all’attività di ricerca presso lo scavo dell’insediamento protostorico del Monte Croce Guardia. Oltre alle operazioni sul campo, tra settembre e novembre di ogni anno, mi sono occupato della realizzazione delle ricostruzioni tridimensionali di oggetti e strutture provenienti dallo scavo stesso.

Dal mese di marzo 2022, inoltre, collaboro con il laboratorio MAD-Lab, nato dalla sinergia tra il CNR ISPC e il LABSS (Laboratory of Agent Based Social Simulation) dell’Istituto di Scienze e Tecnologie della Cognizione (CNR ISTC), nel quale mi occupo principalmente della programmazione in Python di numerosi strumenti che verranno utilizzati nel corso del progetto. Un’occasione di cooperazione con questi istituiti che contribuisce ad arricchire il mio percorso formativo di una maggiore conoscenza dei metodi statistici e informatici largamente utilizzati all’interno del mio progetto di dottorato e, più generale, in linea con il mio percorso di ricerca.

Lorenzo Cardarelli

Dottorando del corso in Patrimoni archeologici, storici, architettonici e paesaggistici mediterranei (PASAP) | 36° ciclo.

About