Come fare in modo di conservare e rendere accessibile il precedente sito dell'Icar, all'indomani del profondo recente rinnovamento di architettura, grafica e contenuti? Si è posto il problema di dare vita a un progetto che desse modo di salvaguardare il precedente sito web, in quanto testimonianza storica delle attività svolte negli anni precedenti e delle strategie di comunicazione finalizzate alla valorizzazione di tali attività.
Il progetto di conservazione si è reso necessario anche sulla base della valutazione circa la qualità insoddisfacente dei dati disponibili sul precedente sito Icar, vale a dire la raccolta di 63 fermo-immagine istantanei (snapshot) che ne hanno “fotografato” le pagine dal febbraio 2008 al settembre 2016, raccolti da Internet Archive, l’organizzazione privata non profit che persegue l’obiettivo di archiviare il web, onde consentire l’accesso ai contenuti digitali anche quando le pagine che li contengano non siano più disponibili o siano state profondamente modificate.
Consapevole dell’importanza della conservazione dei siti web, l’Icar ha applicato i princìpi, le metodologie e le tecniche del web archiving, cioè il processo di raccolta e conservazione dei siti, così come si è andato definendo negli ultimi quindici anni. La prima fase dell’articolato progetto di recupero del precedente sito dell’Icar è consistita nell’individuazione e nell’analisi dei tool di harvesting e memorizzazione dei siti web: il web crawler prescelto è stato Heritrix, distribuito con licenza open source. Il processo di harvesting ha permesso di archiviare gran parte dei contenuti del sito, anche se sono rimasti esclusi i link esterni e il collegamento ad alcuni documenti interni.
La seconda fase del progetto ha portato, attraverso la sperimentazione di due tool software, alla scelta del sistema di visualizzazione e navigazione, individuato in Pywb (Python WayBack for web archive replay and live web proxy), che permette la navigazione di siti web archiviati in formato ARC e WARC.
L’esperienza compiuta sul sito dell’Istituto costituirà la base per l’elaborazione di nuovi progetti che l’Icar intende promuovere nell’àmbito dell’archiviazione web.
Per saperne di più
Sito dell’Icar La conservazione del sito web dell’Istituto centrale per gli Archivi (2008-2016)