15. Mär 2016 Dr. Jens Reinbach, GWLB Anwendungen

Niedersächsisches Online-Archiv

Das Niedersächsische Online-Archiv (NOA) ist der Dokumentenserver der Gottfried Wilhelm Leibniz Bibliothek – Niedersächsische Landesbibliothek (GWLB), Hannover. NOA wurde vor einigen Jahren als Repositorium vorrangig für elektronische Pflichtexemplare und elektronische amtliche Veröffentlichungen eingerichtet.

Screenshot: NOA - Amtsdruckschriften Trefferliste

Die GWLB hat den gesetzlichen Auftrag, Pflichtexemplare der in Niedersachsen erscheinenden Publikationen – sowohl Verlagsveröffentlichungen als auch Erscheinungen außerhalb des Buchhandels – zu sammeln. Die rechtliche Grundlage für die kostenfreie Ablieferung der Pflichtexemplare an die GWLB ist das Niedersächsische Pressegesetz, §12. Die Abgabe amtlicher Veröffentlichungen, die nicht den Bestimmungen des Pressegesetzes unterliegen (§ 7, Abs. 3), ist in einem gemeinsamen Runderlass des MWK, der Staatskanzlei und der übrigen Ministerien vom 11. Dezember 2012 geregelt. Amtliche Veröffentlichungen im Sinne dieses Runderlasses sind Publikationen, die von Behörden, Dienststellen oder Einrichtungen des Landes Niedersachsen herausgegeben oder in ihrem Auftrag erscheinen.

Die Pflichtabgabe elektronischer Veröffentlichungen in unkörperlicher Form ist im Niedersächsischen Pressegesetz bislang nicht geregelt, wohl aber im oben genannten Runderlass für die „Abgabe amtlicher Veröffentlichungen sowie Landkarten und Pläne an Bibliotheken“.

Für die Ablieferung, Archivierung, Erschließung und Bereitstellung von elektronischen Publikationen hat die GWLB zunächst auf Basis der bereits verwendeten Datenbanksoftware openCiXbase den Archivserver NOA eingerichtet und ein Abgabeverfahren entwickelt. Weil die Pflege und Weiterentwicklung dieses Systems, insbesondere hinsichtlich der Anforderungen für eine künftige Pflichtabgabe und Bereitstellung elektronischer Verlagspublikationen (elektronische Pflichtexemplare), nicht mehr gegeben war, wurde eine neue technische Plattform benötigt. Die Wahl fiel auf den Reposis-Dienst der Verbundzentrale (VZG).

Die Verbundzentrale bietet mit MIR (MyCoRe MODS Institutional Repository) ein auf MyCoRe basierendes Repositorium, das speziell auf die Anforderungen eines institutionellen Repositories abgestimmt ist und die Möglichkeit bietet, auch spezifische Anpassungen, wie sie für NOA notwendig waren, durchzuführen.

Bei MyCoRe bzw. MIR handelt es sich um ein Open-Source-Projekt mit deutschsprachiger Community, das bereits vor dem Einsatz in der Verbundzentrale einige Verbreitung in Bibliotheken des GBV hatte. Die Community verbindet somit nicht nur die Entwicklungsarbeit am gleichen Repository-Framework, sondern auch sehr ähnliche lokal geprägte Anforderungen, wie beispielsweise die Anbindung an den GVK, das DINI-Zertifikat oder die Meldepflicht an die DNB. Außerdem ist so ein langfristiger Betrieb und eine kontinuierliche Weiterentwicklung garantiert, insbesondere auch durch den Einsatz von MyCoRe für den DMS-Service der Verbundzentrale und den zentralen Betrieb der digitalen Bibliothek Thüringens unter Federführung der ThULB Jena.

Für die Entwicklung eines auf MyCoRe basierenden neuen NOA wurde auf Grundlage des alten NOA ein Pflichtenheft erstellt. Demnach sollten die elektronischen Dokumente samt zugehöriger Metadaten von der abliefernden Stelle selbst über ein Webformular auf den Dokumentenserver hochgeladen werden können. Neben den Vorgaben für die Eingabeformulare, waren in dem Pflichtenheft der Workflow, die Benutzerverwaltung und das benötigte Zugriffsrechte-Management beschrieben. Daneben gab es eine Reihe weiterer Anforderungen bezüglich Datenaustausch, Oberflächengestaltung, Recherchemöglichkeiten, Titelanzeige u. v. m.

Screenshot: NOA - Metadatenansicht mit integriertem Viewer für PDF-Darstellung

Um elektronische Publikationen auf NOA einzustellen, ist eine Registrierung bei der GWLB notwendig. Die abliefernde Person erhält eine Benutzerkennung und ein Passwort. Nach der Anmeldung am System stehen drei Eingabeformulare zur Verfügung, nämlich für die Ablieferung von monographischem Material, für die „Hefte“ eines Periodikums und für einzelne Artikel. Mindestens die Pflichtfelder müssen ausgefüllt werden. Erst dann kann die Datei hochgeladen werden. Die abgelieferten Publikationen haben zunächst den Status „eingereicht“. In der GWLB werden die Metadaten überprüft, ggf. korrigiert und in der Regel ergänzt, Verknüpfungen zur GND und ggf. zur Zeitschrift hergestellt. Im Anschluss wird eine URN generiert und der Publikationsstatus auf „veröffentlicht“ geändert.

Für die Dokumente stehen derzeit drei Zugriffsberechtigungen zur Verfügung: der uneingeschränkte Zugriff, der Zugriff nur über die Internetgeräte der GWLB sowie ein Zugriff nur für Bibliothekspersonal (für Dokumente, die zwar abgeliefert und nachgewiesen, aber noch nicht veröffentlicht werden dürfen).

Alle amtlichen Veröffentlichungen werden als solche gekennzeichnet und samt der Metadaten von der DNB über die entsprechend eingerichtete OAI-Schnittstelle geharvestet (aufgrund der noch fehlenden Rechtsgrundlage für die Ablieferung elektronischer Pflichtexemplare werden derzeit fast ausschließlich amtliche Veröffentlichungen auf NOA hochgeladen).

Über die OAI-Schnittstelle erfolgt weiterhin die Meldung der in NOA generierten URN an die DNB. Somit sind die URNs erst mit einem Tag Verzögerung funktionsfähig. Aus diesem Grund soll die URN-Registrierung über die OAI-Schnittstelle mittelfristig durch die Verwendung der noch in Entwicklung befindlichen REST-Schnittstelle der DNB abgelöst werden. Dadurch wäre es möglich, sofort gültige URNs zu prägen.

Die Metadaten werden in MODS-XML direkt auf der Festplatte abgelegt. Aus der Anwendung heraus können einzelne Publikationsmetadaten oder eine Liste mehrerer Veröffentlichungen in BibTeX, MODS, RIS, ISI oder DC exportiert werden. Für die Aufnahme der gespeicherten Metadaten in den OPAC steht ein Export in das Pica3-Format zur Verfügung. Dieses kann in die WinIBW übernommen, angepasst und ggf. noch weiter angereichert werden. Von der Titelanzeige im OPAC führt ein aus der URN gebildeter persistenter Link zu dem Dokument in NOA.

Derzeit sind alle in NOA gespeicherten Dokumente im PDF-Format und werden direkt in der Anwendung durch den integrierten Viewer präsentiert. Dies gilt auch für alle gängigen Bild-, Audio- und Video-Formate. Daneben können Dateien in beliebigen Formaten (docx, pptx, xls, html, …), verschachtelt in Verzeichnissen (sowohl gepackt als auch ungepackt) gespeichert werden. Solche Dateien werden dann jedoch nicht gesondert präsentiert, sondern nur zum Download bereitgestellt.

Die Indizierung mit Apache Solr ermöglicht eine umfangreiche Recherche in Metadaten und Volltexten. Außerdem wird ein Blättern in Personen-, Institutionen- und Stichwörter-/ Schlagwörter-Register angeboten. Eine hochwertige Extraktion der Stichworte aus den Metadaten und ggf. auch aus den Volltexten für diese Blättern-Funktion ist geplant.

[erschienen in VZG-Aktuell 2016 Ausgabe 1 ]