TRACKS: websitearchivering met Archive-it

Digitaal erfgoed archiveren omvat ook het archiveren van websites. De Wayback Machine van Internet Archive is de grootste en bekendste webarchiveringsdienst. Naast de gratis Wayback Machine biedt Internet Archive echter ook een betalende dienst met veel meer mogelijkheden: Archive-It. De Canadese Dalhousie University Libraries gebruiken het om de websites van 22 theaters in de regio Nova Scotia te archiveren, de Amerikaanse NYU Libraries en MIAP willen het gebruiken om de websites van jonge componisten (en hun streaming media) te archiveren. Bij PACKED vzw rijpt het plan om uit te testen wat Archive-It kan betekenen voor de archivering van de relevante websites uit de Vlaamse kunstensector.

Wie vandaag aan digitaal erfgoed denkt, kan niet om de archivering van websites heen. De TRACKS-tool 'Hoe archiveer je websites?' maakt je wegwijs in hoe je dat kan doen. Je kan zelf een offline kopie maken van een website, of je kan een video van een surfsessie maken om zo de inhoud en de 'look and feel' van een website vast te leggen. De gemakkelijkste manier is echter om webarchivering uit te besteden aan een organisatie die zich hier specifiek op toelegt. De Wayback Machine van The Internet Archive is de grootste en bekendste webarchiveringsdienst. Bovendien is de basisfunctionaliteit gratis. De Wayback Machine maakt op meerdere tijdstippen momentopnames van allerlei webpagina's. Op http://archive.org/web/ kan je nagaan of een bepaalde url al werd gearchiveerd. Je kan ook zien wanneer dat gebeurde en je kan de gearchiveerde pagina's meteen bekijken. Via de functionaliteit 'Save Page Now' kan je The Internet Archive vragen om een snapshot te maken van een specifieke url. Je krijgt meteen een url naar de gearchiveerde versie van deze pagina te zien. Zo verzeker je de toegang tot de informatie die op een bepaald moment op een webpagina te vinden is. Dat is nuttig als je bijvoorbeeld elders verwijst naar een webpagina. Een onderzoek uit 2014 aan de Harvard Law School onthulde dat in een selectie van juridische tijdschriften gepubliceerd tussen 1999 en 2011 meer dan 70 procent van de links waarnaar onderzoekers verwezen niet langer werkte. Ook binnen Wikipedia is linkrot een groot probleem.

Is de Wayback Machine dan de ultieme oplossing om je website te archiveren? Niet helemaal. Je homepage archiveren biedt geen garantie dat ook alle onderliggende pagina's op dezelfde website worden gearchiveerd. Om dat te bereiken zou je elke url apart moeten opslaan in de Wayback Machine. Bovendien is er geen garantie dat url's die je hebt opgegeven over een bepaalde tijd opnieuw worden gearchiveerd, wanneer de inhoud van de pagina misschien is gewijzigd. Ook pagina's rijk aan multimedia, zoals geëmbedde video's of flashtoepassingen, worden niet steeds volledig en foutloos opgeslagen.

The Internet Archive heeft echter ook een betalende dienst met veel meer mogelijkheden: Archive-It. Waar de Wayback Machine focust op het nemen van een eenmalige snapshot van een pagina, biedt Archive-It de mogelijkheid om volledige websites te archiveren en zelfs collecties van websites aan te leggen. Ga zeker eens snuisteren in de collecties die reeds door internationale musea, archieven, universiteiten, NGO's en bibliotheken werden samengebracht.

Op basis van het domein van je website zoeken de crawlers van Archive-it naar alle onderliggende pagina's. Wie een website archiveert kan zelf instellen hoe vaak een website moet gearchiveerd worden, tot welke diepte de crawlers kunnen doordringen, of ook links naar pagina's buiten het domein van de website zelf gearchiveerd moeten worden,... Je betaalt naargelang de hoeveelheid data je met je archiveringsacties op de servers van The Internet Archive opslaat.

Interessant, denken we bij PACKED vzw. Voor de erfgoedsector, maar ook voor de kunstensector, waar websites vaak nogal vluchtig blijken en de focus begrijpelijkerwijs vooral op de huidige artistieke productie en activiteiten ligt. Zo vonden we een voorbeeld van de Canadese Dalhousie University Libraries die de websites van 22 theaters in de regio Nova Scotia archiveren met Archive-It.

Het idee rijpt om uit te testen wat Archive-It kan betekenen voor de archivering van de relevante websites uit de Vlaamse kunstensector. Biedt de dienst inderdaad wat ze belooft? Hoe zien de resultaten van de websitearchivering eruit? Stuiten we op problemen met bepaalde vormen van inhoud? Hoe vlot instelbaar zijn de parameters? Wat is het kostenplaatje? PACKED vzw doet alvast wat studiewerk en houdt u op de hoogte.

  • Terug naar overzicht
met de steun van de vlaamse overheid

Copyright © 2017 PACKED / Legaal / Privacy / Sitemap
Webdesign by thisconnect.be / pixelman.be