Menu
NL
Datamodel In Wikidata

Datamodel van een record binnen Wikidata.

PACKED vzw: OpenRefine 3.0 maakt het werken met Wikidata eenvoudiger

OpenRefine is een standalone opensource-applicatie geschikt voor zowel data profiling (of analyse) en dataschoning. De applicatie is bijzonder krachtig in de omgang met grote bulken data en vormt daardoor de tool bij uitstek voor het werken met uitgebreide datasets. PACKED vzw maakt gebruik van het programma voor het voorbereiden en analyseren van ruwe data afkomstig uit verschillende domeinen binnen de cultureel-erfgoedsector en sinds kort ook voor het opladen van die data in Wikidata. Met versie 3.0 introduceert OpenRefine enkele nieuwe functionaliteiten die het koppelen van data aan Wikidata aanzienlijk vereenvoudigen.

1. Uitgebreide (Wikidata) Reconciliation Service

Een van de hoofdredenen waarom OpenRefine zichzelf leent tot het incrementeel verrijken van datasets is de ingebouwde reconciliation service. Die maakt het mogelijk om eigen data te koppelen aan items uit externe databases zoals VIAF, AAT, OpenLibrary, Wikidata en Artsy. Voor een uitgebreide lijst van de beschikbare services kun je terecht op de volgende pagina. In het kader van de verscheidene lopende Wikimediaprojecten maakt PACKED vzw gebruik van die extensie voor het importeren van datasets in Wikidata. Daarbij gaat het zowel om het aanvullen van bestaande records als om het aanmaken van nieuwe.

 2. Data Augmentatie

Eens een kolom van de tabel “gereconciled” is kan men aan de hand van de “Add columns from reconciled values...” nieuwe kolommen aanmaken en die vullen met data binnengetrokken uit Wikidata. Dit biedt niet enkel mogelijkheden om eigen datasets aan te vullen en uit te breiden, maar ook om bestaande items op Wikidata te verrijken met de eigen data. Indien in een dataset bijvoorbeeld enkel de stad bekend is, kan men heel eenvoudig het land toevoegen door deze eerst te reconcilen en vervolgens van dat record het corresponderende land binnen te trekken.

3. Verbeterde data upload Wikidata

Voorafgaand aan deze nieuwe versie bestond het proces om data in Wikidata te importeren uit verschillende stappen. Naast het opschonen van de data in OpenRefine moest deze data vervolgens geëxporteerd worden en aan de hand van een rekenblad manueel omgezet tot triples, een semantische structuur eigen aan het datamodel van Wikidata. Vervolgens werden die triples geëxporteerd en aan de hand van een teksteditor omgezet in het juiste format om tenslotte met behulp van de tool QuickStatements opgeladen te worden in Wikidata. Kortom: een tijdrovend en ingewikkeld proces. OpenRefine 3.0 (beta) brengt hier met zijn update een welgekomen verandering in. Vanaf heden is het mogelijk om zowel het opschonen als het opladen, kortom het gehele proces van begin tot eind aan de hand van OpenRefine uit te voeren. Deze nieuwe Wikidata-extensie maakt het mogelijk om zowel Wikidatarecords aan te vullen als om nieuwe records te genereren.

Datamodel In Wikidata Svg

Bovenstaand schema illustreert het datamodel gehanteerd door Wikidata en schept een beeld op het soort data dat doorgaans gekoppeld wordt aan items. OpenRefine 3.0 introduceert het gebruik van Wikidata schema’s waarin men rechtstreeks data uit de voorbereide tabel kan koppelen aan passende properties in wikidata.

Screen Shot 2018 06 12 At 10 09 25

Na het aanmaken van alle properties en het koppelen van de data in de gepaste velden is het mogelijk om aan de hand van een preview het eindresultaat na te trekken en zodoende eventuele fouten redigeren.

Screen Shot 2018 06 12 At 10 10 31

Conclusie

PACKED vzw gelooft dat OpenRefine 3.0 de drempel voor instellingen om zelf aan de slag gaan met Wikidata aanzienlijk verlaagt. OpenRefine 3.0 (beta) is downloadbaar via GitHub. Een uitgebreide handleiding voor het werken met OpenRefine kan je hier vinden.

Vlaanderen - Verbeelding werkt