Metadaten-Extraktion

Ab Mitte Juli wird in Coscine die Metadaten Extraktion sowie das Metadaten Templating verfügbar sein. Zu Beginn wird das Feature jedoch nur auf Anfrage freigeschaltet, sodass Testnutzende dieses ausprobieren und uns ihre Erfahrungen mitteilen können.

Falls Sie das Feature gerne ausprobieren möchten, lesen Sie sich diese Seite durch und senden bei Interesse eine Anfrage an servicedesk@rwth-aachen.de. Bitte geben Sie die URL(s) der Ressource(n) an, für die Sie das Feature freischalten möchten.

Hinweis

Bitte berücksichtigen Sie, dass nur Owner eine solche Anfrage stellen sollen.

Ziel von Metadaten Extraktion ist Zeitersparnis beim Eintragen von Metadaten und das Erhöhen der Vollständigkeit. Durch Metadaten Extraktion können Metadaten aus einer Datei, z.B. eines Bildes automatisch rausgelesen und somit direkt gespeichert werden. Ein einfaches Beispiel hierfür ist das Bild eines Obstkorbes mit verschiedenen Obstsorten (Äpfel, Bananen und Orangen). Wird die Metadatenextraktion darauf angewendet, können Informationen darüber ausgelesen werden, dass es sich um ein Bild handelt, dass z.B. 5 Äpfel, 3 Bananen und 6 Orangen zu sehen sind sowie die Größe des Bildes und so weiter.

Falls das Extrahieren der Metadaten nicht erfolgreich funktionieren sollte, kann dies an dem Extraktor für das von Ihnen verwendete Dateiformat liegen. Schauen Sie daher bestenfalls im GitLab Projekt der Metadaten Extraktion nach, ob für Ihr Dateiformat bereits ein entsprechender Extraktor geschrieben wurde. Falls nicht, wäre dies ein erster Schritt für eine mögliche Lösung.

Durch das Metadaten Templating wird das Speichern von Metadaten zusätzlich erleichtert. Sie finden das Feature unter den Einstellungen Ihrer Ressource (nach Freischaltung) unter dem Reiter Metadatenprofil. Scrollen Sie nach ganz unten, sehen Sie unten links den Button "Extrahierungs-Template Öffnen". Anschließend geben Sie eine Datei an, auf die das Templating angewendet werden soll. Im Anschluss sehen Sie rechts das Metadatenprofil und links die extrahierten Metadaten. Die extrahierten Metadaten können nun verwendet werden, um ein Template für Ihre Metadatenfelder zu erstellen. Dazu können Sie die Werte einfach von links nach rechts ziehen. Bitte beachten Sie hierbei die Einstellungen der Metadatenfelder. Wenn ein Metadatenfeld z.B. den Eintrag eines Strings erfordert und Sie etwas anderes dort eintragen, wird eine Fehlermeldung erscheinen.

Außerdem finden Sie im GitLab Repositorium ein einfaches Beispiel, wie Sie mit einem Python Skript Metadaten extrahieren können. Probieren Sie dies aber auch gerne selbst aus und tragen zu einem Best Practice bei.

In Zukunft wird das Feature durch einfaches An-und Ausschalten von Ownern und Membern auf der Coscine-Plattform aktivierbar sein. Wenn dies umgesetzt wurde, erfahren Sie dies über unsere Mailingliste.