2022.06 2024.06

MyCoRe und Apache Solr

Die MyCoRe-Anwendungen benötigen eine leistungsstarke Suchmaschine für vielfältige Suchoperationen. Die Grundinstallation wird auf dieser Seite beschrieben. Zur Konfiguration einer konkreten MyCoRe-Anwendung gibt es weiterführenden Hinweise im Kapitel Suche.

Einrichtung eines Solr-Servers

Mit dem Release 2022.06 wurde in MyCoRe auf Solr 8.11.x umgestellt. Zur Installation folgt man der Anleitung "Installing Solr" von der Solr Homepage. Die jeweilige aktuelle Solr Version kann dort heruntergeladen werden.

Für das MyCoRe-Release 2024.06 sollte ein Solr 9.x verwendet werden. Zur Installation folgt man der Anleitung "Installing Solr" von der Solr Homepage. Die jeweilige aktuelle Solr Version kann dort heruntergeladen werden.

Es ist sinnvoll, wenn man das Datenverzeichnis nicht innerhalb der Solr-Distribution anlegt.
Gleiches gilt auch für die Log-Dateien.

Mit folgendem Kommando lässt sich der Solr-Server 'individualisiert' starten:

cd .../solr-8.11.x/bin ; solr start -s {my_data_dir} -p {my_port} -m {my_ram} -Dsolr.log.dir={my_log_dir}

Die Cores werden dadurch im Verzeichnis {my_data_dir} erstellt und die Log-Dateien in {my_log_dir}. Beide Verzeichnisse müssen vorher angelegt werden. Im Produktivbetrieb wird der Speicher (RAM) per Umgebungsvariable gesetzt: SOLR_HEAP="2g".

Eine detailierte Beschreibung der Startparameter und weitere Konfigurationsmöglichkeiten befindet sich auf der Seite "Solr Control Script Reference". Für den produktiven Einsatz von Solr (Verzeichnisstruktur, init.d-Skript für den automatischen Start, ...) liefert die Seite "Taking Solr to Production". die notwendigen Informationen.

Wenn innerhalb der MyCoRe-Anwendung Volltexte im Alto-Format indexiert werden, ist eine weitere Einstellung notwendig. Das ist der Fall, wenn das Property MCR.Solr.Indexer.File.AccumulatorList den Wert org.mycore.mets.solr.MCRSolrAltoExtractor enthält.
Dann sollte beim Solr-Start zusätzlich der Parameter -Dsolr.jetty.request.header.size=524288 verwendet werden. Dadurch steht bei der Indexierung ausreichend Platz für die Übertragung der Wort-Koordinaten zur Verfügung. Im Produktivbetrieb kann der Parameter über die Umgebungsvariable SOLR_OPTS gesetzt werden.

Damit ist die Solr-Installation abgeschlossen.

Konfiguration

Für jede MyCoRe-Anwendung müssen jetzt ein oder mehrere Solr-Kerne angelegt werden. Die Konfiguration der Kerne wird im Abschnitt Solr-Nutzung beschrieben.