Extracts, transforms en laadt (ETL) een BAG extract in een postgres database.
Version 0.0. Work in progress: does not work yet.
De Basisregistratie Adressen en Gebouwen (BAG) bevat informatie over (in principe) alle adressen en gebouwen in Nederland. Deze data wordt bijgehouden door gemeenten, verzameld en gebundeld door het Kadaster en vervolgens als open data ter beschikking gesteld.
Deze data is beschikbaar in XML-formaat. Waar de meesten behoefte aan hebben is een database met BAG gegevens. Het project NLExtract converteert XML naat tabelvorm en laadt de tabellen in een database.
De BAG data van het Kadaster is hier beschikbaar.
Voor het verdere loop van deze handleiding gaan we ervan uit dat de data is gedownload als lvbag-extract-nl_2021-11.zip
in de directory /path/to/bag-extract
. Je mag er natuurlijk je eigen namen aan geven.
Installatie en gebruik van postgres met postgis toelichten.
NLExtract kan op twee manieren worden ingezet:
- zonder Docker
- met Docker
[Te doen]
`docker run \
--name nlextract \
--add-host=host.docker.internal:host-gateway \
-v ${BAG_X}/lvbag-extract-nl_2021-11.zip:/work/bag.zip nlextract/nlextract:latest \
bagv2/etl/etl.sh \
-a host=tinctoris \
-a schema=nl \
-a bag_input_file=/work/bag.zip \
`