Wolfgang Binder
Anforderungen an Internet-basierte Informationssysteme von Bibliotheken
Einleitung
Der Titel meines Vortrags "Anforderungen an Internet-basierte Informationssysteme von Bibliotheken" ist fast gleichlautend mit dem Thema des kürzlich [vom 15. - 17. Januar 1996] in Bielefeld stattgefundenen Workshops "Internet-basierte Informationssysteme der Bibliotheken". Am Ende der insgesamt sehr interessanten Abschlußdiskussion zu dieser Veranstaltung blieben verschiedene Fragen offen, z.B. was Internet-basierte Informationssysteme von Bibliotheken eigentlich sind - ob sie zur Klasse der intellektuell erstellten Informationsdienste gehören, oder ob sie in einem noch genauer zu präzisierenden Sinne Suchmaschinen-Anwendungen sind. Unklarheit herrschte auch in der Frage, was Internet-basierte Informationssysteme eigentlich nachweisen sollten. Ich freue mich, nach der zwischenzeitlichen Denkpause diese Diskussion hier wieder aufnehmen zu können, ohne daß ich den Anspruch erhebe, die Fragen hier abschließend zu beantworten.
Ich möchte nicht verschweigen, daß ich einer Fachreferentengruppe angehöre, die inhaltlich-konzeptionelle Vorgaben für ein Internet-basiertes Informationssystem der nordrhein-westfälischen Hochschulbibliotheken mit Namen IBIS erarbeitet. Die Mitarbeit an nordrhein-westfälischen Projektaktivitäten hat meine Sicht der praktischen Probleme mitbestimmt. Meine Statements zu praktischen Aspekten sollen aber nicht als Information zu IBIS oder zum Planungsstand von IBIS verstanden werden.
Zum Schluß noch eine Anmerkung zur Terminologie: Da der Internet-Bezug klar ist, werde ich anstelle von "Internet-basierten Informationssystemen von Bibliotheken" i.a. die Kurzbezeichnung "bibliothekarische Informationssysteme" verwenden.
Was sollen bibliothekarische Informationssysteme leisten?
Ich habe den ersten Punkt - den Zugriff auf elektronische Bibliotheksbestände - hier nur der Vollständigkeit halber erwähnt und werde mich im folgenden auf den Nachweis von Fachinformation im allgemeinen konzentrieren. Zwei Dinge sollten bei dieser Aufgabe nicht übersehen werden: Nur ein kleiner Teil des Internet betrifft Informationen, um die Bibliotheken sich in der Vergangenheit explizit gekümmert haben, also in irgendeinem Sinne bibliotheksspezifische Materialien. Von daher sollten wir Bibliothekare mit Bescheidenheit und Augenmaß an diese Aufgaben herangehen und nicht mit dem Anspruch, daß gerade wir aufgrund unserer Tradition und Erfahrung berufen und in der Lage sind, Ordnung in das viel zitierte Chaos des Internet zu bringen. (Mich hat im übrigen das Argument von Traugott Koch in seinem Bielefelder Vortrag beeindruckt, daß die Ansprüche, die jetzt an das Internet gestellt werden, im Bereich der Printmedien nicht annähernd realisiert sind).
Zum anderen sollten wir auch sehen, daß wir nicht die einzigen sind, die dieses Feld bestellen:
Im Bereich der Online-Datenbanken haben die Bibliotheken, als wir noch in einer geordneten Informationswelt mit festen Zuständigkeiten lebten, die Ordnungs- und Nachweisfunktionen weitgehend den Fachinformationszentren überlassen. Um die eigentliche Dokumentation der Fachinformationen haben sich seit eh und je in besonderer Weise die Fachgesellschaften gekümmert. Diese haben das Potential des Internet für Angebot und Nachweis wissenschaftlicher Informationen relativ frühzeitig erkannt und sind in diesem Bereich schon sehr aktiv. Dabei repräsentieren sie noch mehr als die Bibliotheken die spezifisch wissenschaftliche Benutzerperspektive.
Als 1994 die "Fachinformation im Internet" als neues bibliothekarisches Aufgabenfeld thematisiert wurde, und auch bereits Projektaktivitäten in dieser Richtung angedacht wurden, habe ich mir erlaubt - natürlich als Privatperson bzw. als Listenmitglied - einige Ansprechpartner der Fachgesellschaften in Sachen Fachinformation via E-Mail um ihre Einschätzung und kritischen Kommentar zu bitten, unter dem Gesichtspunkt einer sinnvollen Bündelung der verschiedenen Aktivitäten. Ich habe u.a. gefragt, inwieweit sie in einer globalen Erschließung von Fachinformationen nach einheitlichen klassifikatorischen oder verbalen Erschließungsmethoden eine sinnvolle Ergänzung zu deren eigenen Aktivitäten sehen würden. Der angesprochene Vertreter der Physik betonte die Übereinstimmung der Zielsetzung und lud ein, sich an einem EG-Projekt zum Aufbau eines Physik-Servers zu beteiligen. Ein sehr kritischer und nachdenklich stimmender Kommentar kam aber von einem Lehrstuhlvertreter des Arbeitskreises Fachinformation der Gesellschaft für Informatik, in dem die Meinung vertreten wurde, daß allein die quantitative Dimension des Vorhabens die Bibliotheken auch bei vorhandener Kompetenz bei weitem überfordern dürfte. (Und dies wurde bereits 1994 geäußert!)
Welche Informationen sollen nachgewiesen werden?
Ich glaube, daß dieser Stellungnahme falsche Annahmen hinsichtlich der geplanten bibliothekarischen Aktivitäten zugrunde lagen. Dennoch macht sie die Dimension der Aufgabe deutlich, denen wir uns als Bibliotheken möglicherweise gegenüber sehen. Damit stellt sich aber die Frage nach dem sinnvollen Umfang der bibliothekarischen Aktivitäten, insbesondere die Frage, welche Resourcen in bibliothekarischen Informationssystemen angeboten und erschlossen werden sollten. Der thematische Oberbegriff bleibt für mich nach wie vor die Fachinformation, wobei sich die Breite und Tiefe der Erschließung dann immer noch am eigenen Leistungsvermögen und an den Ansprüchen orientieren kann, die von der Benutzerseite her an ein solches System gestellt werden. Bei dem letzteren Punkt ist man natürlich weitgehend auf Spekulationen und Plausibilitätserwägungen angewiesen. Aber dennoch soll ein solcher Versuch hier unternommen werden.
Jeder der sich etwas in den Navigation Tools des Internet auskennt, weiß, daß es an die zehn intellektuell oder halb-intellektuell erstellte Informationsdienste gibt, die Fachinformationen nachweisen, m. a. W. solche, die ausgewählte Resourcen nach Fachzuordnung auflisten (YAHOO, WWW Virtual Library, Magellan u.a.) Die Frage, inwieweit bibliothekarische Informationssysteme selbst der Klasse der "intellektuell erstellten Dienste" zuzurechnen sind, werde ich später noch unter der Überschrift "Intellektuelle vs. maschinelle Verfahren" erörtern. Es wäre nun wenig originell und würde auch dem Benutzer nicht sehr viel bringen, wenn ein bibliothekarisches Informationssystem die genannten Dienste im wörtlichen oder im übertragenen Sinne kopieren würde, also versuchen würde, etwas besser zu sein als andere und sich damit in eine unsinnige Konkurrenz zu bereits vorhandenen Diensten begeben würde. Ein bibliothekarisches Informationssystem sollte vielmehr ein eigenes Profil entwickeln und dabei den Schwerpunkt auf solche Informationsresourcen legen, um die sich Bibliotheken schwerpunktmäßig kümmern, insbesondere also Publikationen. Der bibliothekarische Informationsservice BUBL im UK ist ein gutes Beispiel für einen solchen bibliotheksorientierten Ansatz. Die anderen Informationstypen (z.B. organisatorische, institutionelle, didaktische Informationen) haben in einem Fachinformationsangebot aber gleichfalls ihre Berechtigung. Es sollten aus den genannten Gründen aber nur die wichtigen Resourcen explizit nachgewiesen werden, die übrigen ggf. über Links auf entsprechende vollständige Listen. Ich komme im Detail noch hierauf zurück. Eine solche Konzeption würde ein "rundes" Fachinformationsangebot beinhalten, das aber den spezifischen Nutzererwartungen an ein bibliothekarisches Informationssystem Rechnung trägt.
Ich beginne mit den bibliotheksspezifischen Informationen, die möglichst umfassend nachgewiesen werden sollten. Zu den Publikationen, die hier natürlich hergehören, zählen elektronische Zeitschriften, Bücher, Datensammlungen, Preprint-Archive usw. Im Internet kommen aber noch weitere Informationstypen hinzu: Diskussionslisten, Newsgroups und die sog. FAQs, die sozusagen die Extrakte der Newsgroup-Diskussionen darstellen. Man muß hier die allgemeine Definition zugrunde legen, daß Bibliotheksinformationen alle codifizierten Formen intellektueller Erkenntnis- und Schaffensprozesse umfassen sollten. Ich plädiere dafür, im Prinzip alle elektronischen Publikationen explizit nachzuweisen bis auf "elektronisches Kleinschrifttum", also spezielle Publikationen in der Art von Mitteilungen, Reports usw. Man weist also im wesentlichen das nach, was Bibliotheken in gedruckter Form auch sammeln und nachweisen würden, und läßt das weg, was man in gedruckter Form als "graue Literatur" bezeichnen würde. Bei dem Problem des Weglassens geht es natürlich um die Begriffe "Masse" und "Qualität". Dies ist ein zugegebenermaßen problematischer Punkt, auf den ich später noch zurückkomme. Diskussionslisten und Newsgroups wird man nur in toto nachweisen, also keine einzelnen Beiträge. Bei den FAQs könnte man sich bei Newsgroups mit Niveau auch Einzelnachweise vorstellen. In den Kontext der genannten bibliotheksspezifischen Informationen gehören auch Bibliographien und Datenbanken, beispielsweise WAIS-Datenbanken. Bei dem Versuch, die Zahl der URLs abzuschätzen, die in diesem bibliothekarischen Kernbereich des Informationssytems explizit erfaßt werden könnten, bin ich auf eine Größenordnung von 4000 - 10000 URLs gekommen.
Zu den weiteren Fachinformationen gehören, wie schon erwähnt, organisatorische und institutionelle Informationen, die eine ausgesprochene Domäne der bereits existierenden intellektuell erstellten Dienste sind, und hier nicht schwerpunktmäßig erfaßt zu werden brauchen - mit Ausnahme von Fachbibliotheken, Archiven und Spezialverlagen, die in gewissen Sinne noch dem vorherigen Komplex zuzurechnen sind. Davon abgesehen muß man von der Bedeutung her abwägen, was man explizit aufführt und in welchen Fällen man Links auf vorhandene Listen legt. Die wichtigsten Fachgesellschaften und wissenschaftlichen Organisationen sollten schon aufgeführt werden; lange Listen von Instituten dagegen nicht.
Ein weiterer Komplex umfaßt alles, was mit Lehrangeboten, Fortbildung, Didaktik und Visualisierung zusammenhängt, auch elektronische Museen. Im Bereich Lehrangebote wird man qualifizierte Kurse von Internet-Universitäten explizit aufführen. Es gibt aber auch eine Unmenge Tutorials, K12-Courses usw., die man unmöglich alle nachweisen kann, bei denen man sich also auf eine Auswahl oder den Nachweis von einschlägigen Dokumentationen beschränken muß (da sie in der Regel auch keine wesentlichen fachlichen Erkenntnisse beinhalten). Ähnliches gilt für audiovisuelle Materialien. Bei Informationen, die auch etwas für das Auge bieten und etwas Anregung im trockenen Informationsgeschäft geben, sollte man aber auch nicht zu puristisch sein. Elektronische Museen sollte man i.d.R. nachweisen.
Die folgende Folie [hinten] listet die verschiedenen in Betracht kommenden Informationstypen auf und stellt zugleich einen Vorschlag für die Gliederung einer fachlichen WWW-Seite dar. Diese Übersicht ist natürlich nicht in der Lage, die thematischen Schwerpunkte richtig wiederzugeben, die den besonderen Charakter eines bibliothekarischen Informationssystems ausmachen. Auf dem Bielefelder WWW-Server [http://www.ub.uni-bielefeld.de] können schon einige noch im Aufbau befindliche Seiten besichtigt werden, die mehr oder weniger nach diesem Schema gegliedert sind, z.B. zu den Fachgebieten Sozialwissenschaften und Physik.
Ich komme noch einmal auf einen wesentlichen Punkt, nämlich die Gründe, sehr spezielle Publikationen wegzulassen:
Zwei Punkte erscheinen mir an dem eLib Programme wichtig: Erstens: Man beginnt nicht gleich mit einer flächendeckenden Erschließung von Fachinformationen, sondern mit überschaubaren Teilprojekten. Zweitens: Man mutet sich diese Aufgabe nicht alleine zu, sondern versichert sich der Mitarbeit von Fachgesellschaften und wissenschaftlichen Institutionen. Ich fürchte, daß solche Partnerschaften bei uns nicht zustande kommen, weil die notwendigen Kooperationspartner bei uns traditionell wenig Berührung haben und zu sehr eigene Wege gehen, um ihre Bemühungen in einem synergistischen Effekt zusammenzuführen. Eine weitere Schwierigkeit ist die, daß solche Kooperationen a priori nur auf fachlicher Ebene vereinbart werden können. Das beißt sich aber etwas mit dem bei uns durchweg favorisierten, fächerübergreifenden Ansatz.
Ich brauche die Motivation für das eingangs dargestellte Konzept an dieser Stelle natürlich nicht noch einmal zu wiederholen. Es kann festgestellt werden, das die Realisierung fachlich und von der personellen Basis her von den Bibliotheken geleistet werden kann. Außerdem ist eine möglichst umfassende Erschließung der bibliotheksspezifischen Resourcen eine Forderung, die an jedes von Bibliotheken organisiertes Informationsangebot zu stellen ist. Auf alle Fälle sollte man das System möglichst skalierbar konzipieren, was Spezialisierungsgrad und Erschließungstiefe der nachgewiesenen Resourcen betrifft, um sich spätere Erweiterungen in der Zielrichtung nicht zu verbauen.
Wie soll der Nutzer auf die nachgewiesenen Resourcen zugreifen können?
Die Antwort ist sehr einfach: über fachlich gegliederte WWW-Seiten und über eine in das WWW-Informationsangebot zu integrierende Datenbanksuche, da dies Standard ist. Die Frage ist dabei, ob alles, was in der Datenbank erfaßt ist, auch auf den Seiten für das Browsing erscheinen muß. Dies gilt besonders für sehr spezielle Dokumente.
Das WWW-Seitenangebot ist natürlich fachlich gegliedert, die einzelnen Seiten sind i.a. nach Informationstypen unterteilt.
Die Datenbank sollte von der Konzeption und dem Design her auf die Erfordernisse der Endnutzung ausgerichtet sein. Wichtig ist die Kombinierbarkeit aller Erschließungsmerkmale. So sollten Suchen z.B. fachlich eingeschränkt werden können - nach Subject Trees oder im Falle einer Systematisierung nach Notationsbereichen, sowie auf Formaltypen beschränkt werden können (z.B. eine Suche unter dem Stichwort "social" auf den Formaltyp "Zeitschrift"). Die Treffer sollten auf anklickbaren HTML-Seiten bzw. Ergebnislisten präsentiert werden, wobei verschieden ausführliche Anzeigeformate vorzusehen sind.
Wie sollen die nachgewiesenen Resourchen erschlossen werden?
Ich komme nun zur inhaltlichen Erschließung der nachgewiesenen Resourcen. - Auf die Frage der "Katalogisierung", d.h. der Formalerschließung, möchte ich gern am Schluß eingehen. - Für das Browsing reicht es im Prinzip aus, ein systematisch gegliedertes Seitenangebot zu haben und die Zuordnung der Dokumente zu den einzelnen Seiten explizit zu definieren. Insbesondere mit Blick auf eine automatische Generierung der WWW-Seiten empfiehlt sich aber eine echte Systematisierung der Dokumente. Die Tiefe dieser systematischen Erschließung sollte dann der maximalen Gliederungstiefe des Seitenangebots für das Browsing entsprechen. Für die eigentliche Sacherschließung der Internet-Resourcen, insbesondere spezieller Resourcen, kommt eine Klassifikation wohl weniger in Betracht.
Bei der Datenbanksuche ist davon auszugehen, daß die Nutzer überwiegend nach verbalen Suchbegriffen suchen - seien dies nun potentielle Stichwörter aus der Dokumentenbeschreibung oder Deskriptionen. Das primäre Problem besteht darin, in einer Datenbank von zunächst vielleicht nur einigen tausend Resourcen eine ausreichende terminologische Basis für eine Suche zu schaffen, was durch Verwendung freier Deskriptoren oder durch Hinzunahme charakteristischer Stichwörter aus dem Dokument selbst erreicht werden kann. Kommt eine thesaurus-basierte verbale Sacherschließung hinzu, so ergeben sich die besonderen Anforderungen vor allem daraus, daß mit einer Konsultierung des Thesaurus durch die Benutzer kaum zu rechnen ist, ebenso wenig mit der Bereitschaft, für verbale Suchen verschiedene Suchfelder zu benutzen, beispielsweise eines für Stichwörter, ein anderes für Schlagworte. Die Deskriptoren sollten daher zum einen die Fachterminologie widerspiegeln, zum anderen in der gleichen Sprache formuliert sein, wie sie auch überwiegend für die Stichwortsuche benutzt wird. Eine weitere, mehr grundsätzliche Forderung ist die Verwendung eines einheitlichen Vokabulars.
Eine weitere Form der Erschließung ist die Zuordnung eines Informationstyps (Newsgroup, Zeitschrift, Organisation usw.).
Wie findet man die Resourcen, die nach den eingangs dargestellten Konzept nachgewiesen werden sollen?
Hierfür kann man sicher kein bestimmtes Vorgehen obligatorisch machen, da es verschiedene Erfolgsrezepte geben mag, und auch die Situation in verschiedenen Bereichen unterschiedlich ist. Ich möchte mehr im Sinne einer Anregung über ein Verfahren berichten, das sich für den anvisierten Umfang des Resourcennachweises als sehr effizient erwiesen hat. Ich habe als Einstieg intellektuell erstellte Informationsdienste benutzt (in der Art von YAHOO, Magellan, Netlink Server u.a.), aber nicht, um diese direkt auszuwerten. - Dies ist zwar im Einzelfall auch lohnend, aber nicht besonders originell. - Ich habe sie vielmehr benutzt, um ergiebige fachliche Informationsseiten (von Instituten, Organisationen, Gesellschaften) zu identifizieren. Solche fachlichen Informationsseiten sind im Angebot von intellektuell erstellten Informationsdiensten besonders gut berücksichtigt.
Bei der Bearbeitung des Bereichs Physik habe ich konkret aus den etwa 400 Nachweisen des Magellan ca. 40 gute Informationsseiten identifiziert und nach Informationstypen ausgewertet, wobei ich wahre "Perlen" gefunden haben (relativ vollständige Auflistungen von Preprintarchiven, Zeitschriften oder Newsgroups). Zu berücksichtigen ist - auf den Hintergrund der Kritik an intellektuell erstellen Informationsdiensten -, daß diese Informationsseiten in ihrer Gesamtheit ständig aktualisiert werden. Der Vorbehalt, daß die gefundenen Informationen zufällig sind, wird abgeschwächt, wenn man bei der Arbeit zu dem Eindruck gelangt, daß die Auswertung weiterer Seiten keine wesentlich neuen Informationen zutage fördert. Die zusammengetragenen Informationen können i.d.R. als wissenschaftlich relevant angesehen werden, was bei Resourcen, die nach Formalkriterien aus fächerübergreifenden Verzeichnissen selektiert werden, z.B. Zeitschriftenverzeichnissen, nicht immer der Fall zu sein braucht. Die Begrenzung des Verfahrens liegt darin, daß die so ermittelten Informationsseiten i.a. keine guten Quellen für sehr spezielle Dokumente sind, deren Verzeichnung in bibliothekarischen Informationssystemen aber als problematisch angesehen wurde.
Das geschilderte Verfahren setzt keine Suchmaschinen ein. Nun sind ja die neusten Verheißungen der künstlichen Intelligenz bereits Intelligent Agents, die nach individuellen Suchprofilen Informationen im Internet zusammentragen. Bevor diese digitalen Agenten zur Verfügung stehen, bediene ich mich noch immer gern der humanen Agenten in Form von Bearbeitern fachlicher Informationsseiten, die für mich interessante Fachinformationen zusammentragen. Dabei kommt es nicht einmal darauf an, wie gut und nach welchen Methoden dies jeder einzelne tut, sondern, wie gut und vollständig sie dies in ihrer Gesamtheit tun.
In vielen Fällen lohnt sich natürlich auch die direkte Auswertung intellektuell erstellter Informationsdienste, wobei sich besonders diejenigen anbieten, die die Informationen nach ähnlichen Formalkategorien aufgeschlüsselt haben, die auch hier von Interesse sind (z.B. BUBL, EINET Galaxy).
Zur Organisation des Sammelns und Erschließens von Fachinformationen möchte ich en passè sagen, daß dies in Nordrhein-Westfalen in kooperativer Weise geschehen soll - über "virtuelle Fachreferate", in denen Kolleginnen und Kollegen des gleichen Faches aus verschiedenen Bibliotheken zusammenarbeiten.
Intellektuelle oder maschinelle Verfahren?
Ich möchte mich nun etwas ernsthafter, als ich es gerade getan habe, mit dem Verhältnis zwischen intellektuellen und maschinellen Verfahren im Kontext "Internet-basierte Informationssysteme" beschäftigen und dabei auf die Frage zurückkommen, was letztere leisten sollen. Sie sollen inhaltlich begrenzte, qualifizierte und in irgendeiner Weise auch erschlossene Informationen beinhalten.
Die inhaltliche Begrenzung wird durch den Begriff "Fachinformation" beschrieben. Die Frage, ob Suchmaschinen gezielt nach Fachinformationen suchen können bzw. in der Lage sind, nach inhaltlich-thematischen Kriterien zu suchen, möchte man zunächst rundheraus verneinen. Allerdings bin ich mir hierbei auch nicht ganz so sicher. Wenn man die Einschätzung hört, daß die Ära der globalen, universellen Suchmaschinen in einigen Jahren vorbei sei, und diese durch Systeme von begrenzten Nachweisdiensten ersetzt würden, dann sollte es auch maschinelle Verfahren geben, die in der Lage sind, begrenzte Resourcen-Sammlungen zu erstellen. (Die Frage, wie man einen Roboter dazu bringt, zwischen Fachinformation und Nicht-Fachinformation zu unterscheiden, würde mich allerdings schon interessieren.)
Die Forderung nach der Qualitätskontrolle möchte ich durch ein Zitat von Derek Law (in der deutschen Übersetzung) aus seinem Vortrag, den er kürzlich in Bielefeld gehalten hat, illustrieren: "In einer Umkehrung der Grasham'schen Gesetzes, das schlechtes Geld gutes vertreibt, glauben wir, daß gute Informationen die schlechten vertreiben werden." [Derek Law: Example United Kingdom: FIGIT - Vortrag gehalten auf dem Kolloquium "Elektronisches Publizieren und Bibliotheken", Bielefeld, 5. - 7.2.1996] Eine solche Qualitätsprüfung werden Maschinen in absehbarer Zeit sicher nicht leisten können. Schließlich sollen die Resourcen wenigstens in einer so rudimentären Form erschlossen werden, um z.B. eine simple Frage des Typs beantworten zu können: "Welche elektronischen Zeitschriften gibt es in der Psychologie?" Eine Erschließung, die die Beantwortung einer derartigen Fragen zuläßt (die für eine Maschine natürlich nicht trivial ist), kann ich mir nur auf intellektueller Basis vorstellen.
Ich kann aber zusammenfassen: Für die Fachinformation relevante Resourcen-Sammlungen mögen vielleicht nach Konzepten, die noch nicht bekannt oder noch nicht benannt sind, maschinell zusammengetragen werden können, sie müßten dann aber immer noch intellektuell bewertet und erschlossen werden. Von daher halte ich die Aussage für berechtigt bzw. vertretbar, daß bibliothekarische Informationssysteme intellektuell oder zumindest halb-intellektuell erstellte Dienste sind.
Wenn dem so ist, sind Suchmaschinen dann überhaupt noch im Hinblick auf bibliothekarische Informationssysteme relevant? Ich denke ja.
Eine triviale Anwendung, die ich bereits als gegeben vorausgesetzt hatte, ist die, daß man das bibliothekarische Informationssystem von vornherein als Datenbanksystem realisiert und auf diese Weise das System mit einer Suchmaschinen-Funktionalität ausstattet.
Die andere Perspektive ist die folgende: Auch wenn die Resourcen für bibliothekarische Informationssysteme in nächster Zeit noch nicht durch Roboter bzw. dezidierte maschinelle Verfahren automatisch gesammelt werden können, so schließt dies die Möglichkeit eines Einsatzes von Suchmaschinen bei deren Aufbau und Aktualisierung keineswegs aus. Es ist ein voreiliger Schluß, daß Suchmaschinen beim Sammeln von Informationen für sog. "Intellektuell erstellte Dienste" keine Rolle spielen. Ein Teil der Resourcen basiert zwar auf Hinweisen bzw. Meldungen, ein anderer kommt vielleicht durch gegenseitiges Abschreiben zustande. - Der große Rest muß aber auch irgendwo her kommen. Da das Internet noch nicht als Zettelkatalog vorliegt, der intellektuell besichtigt werden kann, ist anzunehmen, daß die meisten hiervon auch irgendwann über Suchmaschinen recherchiert wurden. Was an diesen Verfahren zu Recht stört, ist, daß dieser Suchmaschineneinsatz unsystematisch, nicht dokumentiert und nicht transparent ist. Transparente Aktualisierungsverfahren unter Einbeziehung von Suchmaschinen sind für intellektuell erstellte bzw. kontrollierte Informationsdienste ein dringendes Desiderat.
Ich hatte von meinen Erfahrungen berichtet, für ein Basisangebot von Fachinformationen eine hinreichend große Zahl fachlicher Informationsseiten auszuwerten (was natürlich gewisse Kenntnisse über die Ergiebigkeit einzelner Informationsquellen voraussetzt). Dieses von der technischen Seite her anspruchslose Verfahren dürfte aber nicht ausreichen, wenn Fachinformationen im Internet in voller Breite ausgewertet sollen. Dies ist der Punkt, an dem man mit Sicherheit über einen gezielten Einsatz von Suchmaschinen nachdenken muß.
Darüber hinaus sollte die Entwicklung neuer Konzepte für Internet Navigation Tools, wenn immer möglich, bibliotheksseitig gefördert werden. Das Ergebnis sind dann nicht apriori bibliothekarische Informationssysteme in dem eingangs skizzierten Sinne, aber zumindest wertvolle Tools, die man dafür einsetzen kann.
Brauchen wir katalogisierte Fachinformationen?
Am Schluß möchte ich noch auf die Frage eingehen, inwieweit Internet-Resourcen katalogisiert werden sollten.
Der Anspruch, Internet-Resourcen zu katalogisieren, ist gleichbedeutend mit dem Anspruch, sie in Katalogen nachzuweisen. Es gibt viele Fälle, in denen eine Katalogverzeichnung aus gutem Grund erfolgen sollte. Dies betrifft elektronische Bücher und Zeitschriften, insbesondere "elektronische Bestände" von Bibliotheken oder elektronische Parallelausgaben zu Printausgaben. Ob Newsgroups, Internet-Museen, Home Pages von Organisationen oder Gelegenheitspublikationen in Bibliothekskatalogen verzeichnet werden müssen, haben die für die Katalogführung Verantwortlichen zu entscheiden. Wenn ja, müssen sie natürlich entsprechend den gültigen Regelwerken katalogisiert werden.
Art und Umfang der formalen Beschreibung von Ressourcen in Internet-basierten Informationssystemen hängen von deren Zweck und Anspruch ab. Für die überwiegende Zahl der Nutzer sind unaufwendig erstellte Beschreibungen völlig ausreichend. Man denke beispielsweise an die Anzeigeformate von Lycos, die rein maschinell erstellt werden. Sie beschreiben erstens die Dokumente in unverwechselbarer Weise und vermitteln zweitens in unterschiedlicher Ausführlichkeit einen Eindruck vom Inhalt der Dokumente. (Es verwundert, daß Katalogisierungsexperten die besonderen Möglichkeiten, die strukturierte Textformate wie HTML für eine maschinelle oder maschinell unterstützte Dokumentenbeschreibung eröffnen, noch gar nicht realisiert haben.) Ich erinnere mich im übrigen, daß Derek Law in seinem bereits zitierten Vortrag deutlich betont hat, daß die Bibliotheksinitiativen im UK auf eine Katalogisierung von Internet-Resourcen verzichten. - Es wäre aber denkbar, solche Dokumentenbeschreibungen im Bedarfsfall durch zusätzliche bibliographische Informationen (z.B. Urheber, Körperschaften) zu ergänzen.
Eine Katalogisierung von Internet-Dokumenten in Fortschreibung traditioneller Regelwerkanwendungen stößt auf große Schwierigkeiten. Angesichts der enormen Variationsbreite der Seiten- und Textgestaltung elektronischer Dokumente wird die Definition eindeutiger bibliographischer Konzepte (Beschreibungskategorien) immer problematischer und deren Anwendung im Einzelfall immer interpretationsbedürftiger und vager - mit der Folge, daß bei restriktiver Regelanwendung Dokumente möglicherweise (und auch in der Realität) nicht mehr gefunden werden können.
Entscheidend aber ist, daß bibliographische Datenformate für Internet-Dokumente ein viel zu enges Konzept darstellen, da sie sich im wesentlichen auf die Beschreibungsmerkmale beschränken, die für gedruckte Publikationen typisch und erfassungswürdig sind. Informationen wie Protokolle, Datenformate, Informationstypen, Aktualisierungsstand, Copyright-Informationen, Identifizierungs-codes, Zugangsinformationen stellen für Internet-Dokumente aber neue wichtige Beschreibungs-elemente dar. Diese sollten nicht in das Korsett von Datenformaten hineingezwängt werden, die für eine andere Art von Objekten geschaffen wurden, sondern sie erfordern von Grund auf neu konzipierte Beschreibungsformate für "Metadaten", die dem Charakter der neuen Dokumente umfassend Rechnung tragen. Die verbale Dokumentenbeschreibung macht hier nur einen mehr oder weniger großen Teil aus mit der Tendenz zur Beschränkung auf das Wichtige und Notwendige (verbunden mit der Option der Erweiterung im Bedarfsfall). In diesem Rahmen lassen sich ggf. regelwerkgestützte bibliographische Beschreibungen als ganzes (z.B. in einer Rubrik "Description") oder als Teile einzelner Felder integrieren. Beispiele hierfür sind das "NISS Information Gateway Template" (NISS: National Information Services and Systems, UK), das auch von BUBL benutzt wird, [http://www.niss.ac.uk/resource-description/bigguide.html] und der "Dublin Metadata Core Element Set" von OCLC [http://www.oclc.org:5046/oclc/research/conferences/metadata/dublin_core_report.html].
Austauschbare Metadaten-Formate haben ein enormes Potential für die Zukunft der kooperativen Erschließung von Internet-Resourcen - insbesondere dann, wenn sie auch Sacherschließungs-merkmale - Deskriptoren oder systematische Notationen - beinhalten. Es geht hier um folgendes Problem: Die bibliothekarischen Informationssysteme, die es jetzt gibt oder in Kürze geben wird, stecken in einem unglaublichen Maße Arbeit in die Doppelerfassung von Dokumenten, während sie gleichzeitig, was die Abdeckung der Internet-Resourcen anbelangt, auf der Stelle treten. Sie benutzen dabei für die Erfassung der unterschiedlichen Beschreibungsmerkmale individuelle Datenformate. Wenn es möglich wäre, sich auf ein gemeinsames Metadaten-Format zu einigen, oder wenn sich ein solches international durchsetzt, könnte dies die kooperative Erschließung durch Informations- und Datenaustausch ein großes Stück voranbringen. [Der Verfasser dankt Traugott Koch für den Hinweis auf den "Dublin Metadata Core Element Set.]
Vorschlag für die Gliederung einer fachlichen Seite nach Informationstypen
Teilgebiete / verwandte Gebiete