Aspekte der Langzeitspeicherung

Das Speicherungskonzept in MONARCH

-
Vortrag auf dem Workshop
"Neue Organisationsformen elektronischer Veröffentlichungen"
Dortmund, 23./24.November 1998
 
 
Christoph Ziegler, TU Chemnitz, Universitätsrechenzentrum
 

Inhalt:

  1. Langzeitarchivierung
    1. Aspekte aus Nutzersicht
    2. Aspekte aus Betreibersicht
    3. Systematisierung
  2. Speicherungskonzept in MONARCH
    1. Grundprinzip
    2. Speichertechnologie
    3. Speicherstruktur
    4. Adressierung
    5. Unversehrtheit
    6. Zusammenfassung

    7.  

1. Langzeitarchivierung

Langzeitarchivierung - Was ist das? Was verbirgt sich hinter diesem Begriff?

Da mit diesem Begriff sicherlich unterschiedlichste Erwartungen, Auffassungen in Verbindung gebracht werden, nachfolgend eine kurze Einführung in dieses Thema.
 

1.1 Aspekte aus Nutzersicht

Unter einem Nutzer sollen hier zwei Personengruppen verstanden werden:

Folgende Fragestellungen sind vorstellbar:

1.2 Aspekte aus Betreibersicht

Betreiber ist diejenige Person bzw. Einrichtung, die diese Technologie zur Archivierung/Veröffentlichung im Internet erstellt hat und nun auch verantwortlich ist, diese am Leben zu halten!

Einige der möglichen Fragestellungen sind:

1.3 Systematisierung

Ein Versuch, die aufgeworfenen Fragen/Probleme zu systematisieren:
 

  1. Verfügbarkeit
  2. Lesbarkeit
  3. Interpretierbarkeit
  4. Unversehrtheit
Konsequenz 


Die logischen Konsequenzen aus diesen Fragestellungen müßen folgende sein:

2. Das Speicherungskonzept in MONARCH

MONARCH steht für Multimedia ONline ARchiv CHemnitz

Existiert seit 1995 und wird gemeinsam von Universitätsbibliothek und Universitätsrechenzentrum betrieben.
 

2.1 Grundprinzip

(hinsichtlich Langzeitarchivierung)

Nutzung existierender Technologien
 

2.2 Speichertechnologie

Fileserving mit AFS, MRAFS, SAM-FS
 
Fileserving mit HSM - AFS,MRAFS,SAM-FS
Legende:
HSM - Hierarchical Storage Management
AFS - Andrew File System
MRAFS - Multiresidentes AFS
SAM-FS - (HSM-Software)

MONARCH, auf der linken Seite des Bildes dargestellt, ist eine Anwendung unter mehreren, die sich um Speicherplatz bewerben. Speicherplatz für neue Dokumente als auch Speicherplatz, der von Dokumenten belegt ist. Letztere Funktionalität wird benötigt, um existierende Dokumente für die Zugriffsmechanismen von MONARCH bereitzustellen (WWW, Recherche, ...). Diese Bewerbung um Speicherplatz geschieht seitens der Klienten anonym gegenüber einer skalierbaren Menge von Fileservern (siehe rechten Bildteil). Auch die Anwendung MONARCH muß also nicht wissen, welcher der Fileserver den Speicherplatz bereitstellt.
Diese anonyme Menge von Fileservern realisiert somit neben der Skalierbarkeit (Erweiterbarkeit) auch die Rechnerunabhängigkeit.
Der dritte Fileserver (rechts unten) demonstriert, mittels eines weiteren angeschlossenen Mediums (aktuell eine Tape-Library), die Medienunabhängigkeit. Dieses weitere Medium stellt gegenüber Platten ein sekundäres Medium dar, auf das nur mittels (im Filesystem integriertem) HSM indirekt über Platte zugegriffen werden kann. Somit ist auch die Medienmigration gegeben.
 

2.3 Speicherstruktur

Das nachfolgende Bild stellt die Integration der in MONARCH enthaltenen Dokumente in der Filesystemhierarchie dar: 



Daraus ist ersichtlich, daß folgende Trennungen vorgenommen sind: Durch die Integration in die Filesystemhierarchie ist somit auch ein Dokumentenzugriff möglich, ohne das WWW bemühen zu müssen. Darüber hinausgehend ist durch den Einsatz von AFS sogar eine weltweite Filesystemhierarchie gegeben, mit entsprechenden Zugriffsmöglichkeiten.
 

2.4 Adressierung

Die statische URL-Adresse ermöglicht die Zitierbarkeit eines Dokuments.

z.B.: http://archiv.tu-chemnitz.de/pub/1996/0012

Alternativ kann der statische Pfadname der Filesystemhierarchie verwendet werden.

z.B.: /afs/tu-chemnitz.de/publication/1996/0012

Die Nutzung von AFS erlaubt die Verwendung eines solchen Pfadnamens als Bestandteil einer weltweiten AFS-Filesystemhierarchie.

Alternativ können zur Lokalisierung eines Dokuments Suchmaschinen sowie die in MONARCH intergrierte Recherche genutzt werden.

Die Struktur der URL-Adresse erlaubt auch das alternative Auffinden eines als Zitat (URL) angegebenen Dokuments:
 

 

2.5 Unversehrtheit

Dieses Thema ist in Arbeit und wird mit der Version 1.3 von MONARCH in Nutzung genommen.

Verwendung finden:

Nach einer notwendigen Konvertierung eines Dokuments wird dieses erneut signiert, als Nachweis der Unversehrtheit des Inhalts.
 

2.6 Zusammenfassung

Abschließend eine Zusammenfassung in Form eines Schichtenmodells:
 

logisch Anwendung MONARCH
Basissoftware WWW,PGP,Harvest
Migrationssystem HSM
Filesystem AFS
physisch Medien Platte,RAID,Tape
Rechner Archivserver
Umgebung Strom, Netz
  Chr.Ziegler

Die zum Vortrag genutzten Unterlagen sind hier einzusehen.