Skip to content

Zuordnen von Datensätzen zu Herausgebern #19

@jze

Description

@jze

DCAT-AP.de sieht vor, dass in einem Katalog Datensätze mehrerer Herausgeber enthalten sind. Im Konventionenhandbuch ist angegeben, dass der dct:publisher angegeben werden MUSS. https://www.dcat-ap.de/def/dcatde/2.0/implRules/#angaben-zum-herausgeber

Der CKAN-CKAN-Harvester sieht bereits eine Möglichkeit vor, Datensätze auf Herausgeber zu verteilen. Dabei gibt es sogar die Möglichkeit, noch fehlende Herausgeber automatisch anzulegen. Hier ist die Stelle im Code: ckanharvester.py

Auch im DCAT RDF-Harvester ist bereits vorgesehen, dass der Datensatz von einem anderen Herausgeber als die Harvest-Source stammt: rdf.py Damit das aktiv wird, muss aber ein IDCATRDFHarvester (Aufruf in rdf.py) einen Eintrag dataset['owner_org'] erzeugen.

Meine Idee ist es, im DCATdeProfile entsprechende Logik einzubauen. Dabei würde ich analog zum CKAN-CKAN-Harvester vorgehen. Nur wenn die Konfiguration remote_orgs gesetzt ist, wird die Logik überhaupt aktiv. Auf Basis von dataset['publisher_name'] wird dann ein Herausgeber gesucht.

  • Ist er vorhanden, wird dataset['owner_org'] passend gesetzt.
  • Ist kein Herausgeber mit dem Namen vorhanden, wird nur bei remote_orgs=create ein Herausgeber mit diesem Namen angelegt und dataset['owner_org'] passend gesetzt.

Klingt das sinnvoll? Dann würden wir uns an der Umsetzung versuchen.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions