Allgemeines zu MyCoRe

Vorbemerkungen

MyCoRe bietet die Möglichkeit verschiedene Softwarekomponenten für die Speicherung und Verarbeitung der Daten (digitale Objekte und zugehörige Beschreibungsdaten) zu verwenden. Dabei spielt das verwendete Betriebssystem eine wesentliche Rolle. Jedes System hat Vor- und Nachteile, die an dieser Stelle kurz aufgezeigt werden sollen. Wir wollen es abschließend dem Anwender überlassen, in welchem System er für seine Anwendung die größten Vorteile sieht.

Betriebssysteme

MyCoRe ist auf Grund seiner vollständigen Implementation in Java unabhängig vom Betriebssystem. Innerhalb der MyCoRe-Community gibt es Installationen unter Unix (Linux, AIX, Solaris), MS Windows und Mac OS. Die Entscheidung für ein bestimmtes Betriebssystem ist stark vom Einsatzzweck und der Verfügbarkeit der zusätzlich benötigten Komponenten abhängig.

Relationale Datenbanken

Im Bereich der SQL Datenbasis werden ab MyCoRe 1.3 alle Zugriffe über die Datenbank-Mapping-Sprache Hibernate realisiert. Dieses garantiert eine einheitliche Programmierschnittstelle gegenüber der Anwendung und gestattet die Nutzung aller durch Hibernate unterstützten relationalen Datenbanksysteme wie HSQLDB, MySQL, PostgreSQL, IBM DB2 und Oracle. Über die Konfiguration von MyCoRe gibt der Administrator der Anwendung an, welche Datenbank konkret zum Einsatz kommt. Standardmäßig wird für DocPortal die HSQLDB verwendet. Dies ist ein sogenanntes leichtgewichtiges, Java-basiertes Datenbanksystem und erfordert keine zusätzlichen Installationen. Der erforderliche Code ist im MyCoRe-Paket bereits enthalten. Für produktive Anwendungsinstallationen sollte jedoch ein den Erfordernissen entsprechendes Datenbanksystem gewählt werden.

Suchindex

MyCoRe stellt eine Volltextsuchmaschine für Metadaten und Texte auf Basis des Apache-Projektes Lucene zur Verfügung. Lucene ist ebenfalls in MyCoRe integriert und bedarf keiner zusätzlichen Installation.

Textextraktion

Zum Extrahieren von durchsuchbaren Volltexten aus Dokumenten werden seitens MyCoRe eine Reihe von externen Anwendungen genutzt. Welche davon bei einer konkreten MyCoRe-Installation zum Einsatz kommen, entscheidet der jeweilige Administrator selbst. Über eigene Plugins lassen sich weitere Komponenten problemlos einbinden. Die jeweilige Software (ps2ascii, pdftotext usw.) muss zusätzlich zu den MyCoRe-Komponenten installiert werden. Derzeit sind für folgende Objekttypen Plugins in MyCoRe integriert: xml, html, txt, ps, pdf, doc, xls, ppt, odt und sxw.

Streaming Server

MyCoRe kann alternativ für die Speicherung von Audio- und Video-Daten Streaming-Server integrieren und zur Datenhaltung nutzen. Getestet und unterstützt wird der Einsatz des Helix-Servers. Dieser muss extern installiert und dann über die Anwendungskonfiguration eingebunden werden.

Webanwendungs-Server

MyCoRe benötigt für die interaktive Arbeit eine Servlet-Engine. Bekanntester Vertreter hier ist Tomcat. Alternativ bietet die MyCoRe-Beispielanwendung DocPortal die Nutzung von Jetty an. Besonders für kleinere Anwendungen stellt es eine interessante Alternative dar. Jetty ist eine javabasierte und leichtgewichtige Anwendung, die ebenfalls in der DocPortal-Distribution enthalten ist. Eine weitere Alternative ist der IBM Application Server. Für Produktionsumgebungen mit einer Apache-Proxy-Anbindung empfiehlt sich jedoch der Einsatz von Tomcat oder WebSphere.

Web-Server

Zur Arbeit mit MyCoRe in Produktionsumgebungen empfehlen wir die Nutzung des Apache-Web-Servers. Damit ist es u.a. möglich der Anwendung eine URL auf Port 80 ohne weitere Portangaben zuzuweisen (virtuelle Hosts). Bei der Verwendung des IBM WebSphere Application Servers ist ein IBM Webserver (basierend auf Apache) bereits integriert.

Die Beispielanwendung

Zur Demonstration des Leistungsumfangs von MyCoRe wird eine Beispielanwendung mitgeliefert. Diese soll anschaulich die Funktionalitäten von MyCoRe aufzeigen und gleichzeitig eine praxisnahe Anwendung darstellen. Als Anwendungsszenario haben die Entwickler einen Dokumenten-Server mit Namen DocPortal gewählt. Die Installation und Nutzung von MyCoRe und der darauf aufbauenden Anwendung DocPortal wird im Verlauf dieser Dokumentation in allen Einzelheiten besprochen. Ziel ist es, Interessierten von Anfang an einen vollständigen und sofort nutzbaren Dokumenten-Server an die Hand zu geben.

Installationswege

Für die Installation der Beispielanwendung DocPortal gibt es verschiedene Wege. So ist es möglich ein vorgefertigtes Code-Paket herunterzuladen oder sich den gewünschten Codestand über Subversion zu holen. Beide Installationswege werden hier beschrieben. Es wird erklärt, wie die Beispielanwendung DocPortal schrittweise zu installieren ist und wie der Administrator per Konfiguration diese Anwendung in seine Umgebung einpasst. Hierbei ist zu unterscheiden, ob das Zielsystem unter den Betriebssystemen UNIX (Linux) oder MS Windows arbeitet. Auf die jeweiligen Unterschiede wird in den einzelnen Installationsschritten ggf. näher eingegangen. DocPortal kann auch unter Mac OS installiert werden. Hierauf wird in der Anleitung aktuell nicht explizit eingegangen. Bei Fragen wenden Sie sich bitte an die mycore-user@lists.sourceforge.net .

Die Release-Stände sowie aktuelle Prereleases können unter Download als *.zip bzw *.tar Datei heruntergeladen werden. Eine weitere Möglichkeit besteht in der Nutzung der Subversion-Quellen. Hier erfolgt die Auswahl der Release-Stände mittels Tags. Für den aktuellen Entwicklerstand ist der Zweig 'trunk' auszuwählen. Verwiesen sei in diesem Zusammenhang auch auf die Projektseite bei Sourceforge.