Harvesting
Hier werden die beiden verfügbaren Harvesting-Quellen, S3 und CSW, beschrieben. Zudem wird der Ablauf zum Einrichten eines Harvestings aufgeführt.
Übersicht
Die Harvesting-Lösung bietet sich an, wenn die Metadaten in einer eigenen Applikation / Umgebung erfasst und verwaltet werden sollen. Die Metadaten werden durch das Harvesting in den Datenkatalog integriert und unterscheiden sich für den Suchenden lediglich durch das kleine Harvesting-Icon, welches den betreffenden Metadatensatz kennzeichnet.
Für den Dateneigentümer / Metadatenerfasser gibt es im Vergleich zur direkten Erfassung von Metadaten folgende Unterschiede:
- Geharvestete Metadaten werden sofort publiziert.
- Innerhalb der Applikation kann man die Metadaten nicht editieren.
- Innerhalb der Applikation können die Metadaten nicht validiert werden (mehr zur Validierung siehe weiter unten)
- Die Funktion der Wiederverwendbaren Objekte (Verzeichnisse) steht nicht zur Verfügung.
Harvesting-Lösungen
Es stehen folgende zwei Harvesting-Lösungen zur Verfügung:
S3
Der S3-Partner kann Metadaten via Internet direkt auf einen S3-Server hochladen. Auf Anfrage bei geocat@swisstopo.ch wird dem S3-Partner ein S3-Bucket eingerichtet, welcher als Schnittstelle für den Transfer der Metadaten dient. Von dort werden die Metadaten von der geocat.ch-Applikation in einem vordefinierten Intervall regelmässig geharvestet und in den Katalog integriert.
Das Import-Format (XML) ist nach dem GM03 Standard definiert. Die Daten können auch in ein .mef-File gepackt werden. Ein xml-Beispiel finden Sie hier:
CSW
Dieser Partner behält seine Metadaten im eigenen Umfeld. Er öffnet seinen Geodatenkatalog für den Suchdienst von geocat.ch. Dafür muss dieser Katalog die Anfragen (z.B. nach dem OGC-Standard CSW 2.0.2), die von geocat.ch geschickt werden verstehen, sie in eine interne Suche umwandeln und eine entsprechende Antwort zurückschicken. Der Katalog dieses Partners kann unter Umständen auch mit einem Modell, das vom GM03-Standard abweicht, implementiert werden.
Harvesting-Konfiguration
In der Harvesting-Konfiguration kann man das Abfrageintervall festlegen. I.d.R. werden die Metadaten 1 x täglich geharvestet.
Validierung geharvesteter Metadaten
Einmal monatlich wird die Validität der geharvesteten Metadaten automatisch überprüft. Für alle Metadaten, die nicht dem Schweizer Profil für geografische Metadaten (derzeit iso19139.che) entsprechen, wird eine E-Mail mit einer Liste der ungültigen Metadaten an die Eigentümer der Metadaten gesendet.
Die fehlerhaften Metadaten können folgendermassen überprüft werden:
- Installation des externen Validators (Webanwendung und API): Swiss Geometadata Validator (Beta)
- Vergleich mit kommentiertem XML, welches dem Profil iso19139.che entspricht.
- Weitere Informationen über das Schweizer Profil für Geometadaten und seine Implementierung in XML (iso19139.che)
