Zur Geschichte der Dokumentation in der Chemie

(mit einigen persönlichen Erinnerungen aus der methodischen Entwicklung)

Ernst Meyer

Dieser Text war lange Zeit zugreifbar auf der Webseite "Bausteine zur Geschichte der Informationswissenschaft und -praxis in Deutschland", der Universität Düsseldorf, die heute nur noch über die Internet Archive Wayback Machine zu finden ist!

Mit Erlaubnis der Witwe des 2000 verstorbenen Pioniers der deutschen Chemie-Dokumentation Ernst Meyer wird der Text hier nochmals publiziert.


Mit im heutigen Sinne wissenschaftlichen Methoden werden die Natur der Stoffe und ihre Umwandlungen erst seit etwa 200 Jahren gründlicher untersucht. Aber das Wissen, das sich dabei ansammelte, erwies sich als so nützlich, daß rasch eine eigene Disziplin - die Chemie - heranwuchs, die es in immer zunehmenden Tempo vermehrte. Von manchen anderen Fachrichtungen unterscheidet sich dieser Wissensschatz dadurch, daß er sehr "langlebig" ist, d.h. daß er nur sehr langsam seinen Wert verliert. Das mag einmal durch die Vielfalt chemischer Verbindungen und ihrer Eigenschaften sowie durch die Reproduzierbarkeit der Experimente bedingt sein, die gerade in älteren Jahrzehnten sehr sorgfältig ausgearbeitet und beschrieben wurden; zum andern aber dienen uns früher synthetisierte Stoffe heute wieder als Ausgangsmaterialien und müssen dazu nochmals isoliert oder hergestellt werden. Mögen einzelne präparative Methoden inzwischen auch durch neuere überholt sein, die meisten bleiben aktuell, und hundert Jahre alte Herstellungsvorschriften werden noch heute gern "nachgekocht".

Angesichts der Fülle, der raschen Zunahme und intensiven Nutzung sowie der langfristigen Verwertbarkeit dieses Wissensschatzes ist es nicht verwunderlich, daß er bald geordnet und erschlossen werden mußte, und daß sich daher in der Chemie frühzeitig eine umfangreiche und gründliche Dokumentation entwickelte. Hinzu kam, daß der Nutzerkreis weltweit sehr groß war, zumal die sonst oft hinderlichen Sprachbarrieren sich als verhältnismäßig harmlos erwiesen. Denn die Chemiker bedienen sich weitgehend einer international verständlichen Formelsprache, und ihre Begriffe sind "hart", d.h. recht scharf definiert - zum Teil sicher eine Folge der Quantelung von Materie und Energie, die fließende Übergänge selten zuläßt.

So entwickelte die Chemie schon in recht jungen Jahren eine umfangreiche Dokumentation. Die ältesten Fachzeitschriften entstanden in Frankreich 1789, in Deutschland 1832 und in England 1848, das Chemische Zentralblatt als umfassendes Referateorgan gab es seit 1830. Auch die ersten Handbücher, die die Literatur kritisch exerpierten und besser zugänglich machten, entstanden bald darauf. Gmelins Handbuch der anorganischen Chemie erschien 1837 und umfaßt heute nahezu 150 Bände; Beilsteins Handbuch der organischen Chemie folgte 1887, nachdem dieser Zweig durch die ersten synthetischen Farbstoffe und seit August Kekule durch das Denken in Strukturformeln in den sechziger Jahren rasch aufgeblüht war. Weitere wichtige und lebhaft benutzte Handbücher sind: Landolt-Börnstein, Physikalisch-chemische Tabellen; Houben-Weyl, Methoden der Organischen Chemie; Ullmanns Encyclopädie der technischen Chemie; Winnacker-Küchler, Chemische Technologie; und andere. Es ist wohl kein Zufall, daß die meisten Chemie- Handbücher in Deutschland entstanden sind und hier von großen Instituten fortgeführt werden; der hohe Stand der Chemie und die Gründlichkeit wissenschaftlicher Arbeit hierzulande haben sicher dazu beigetragen. Der wohl wichtigste deutsche Beitrag zur Chemie-Dokumentation freilich, das Chemische Zentralblatt, ist den Kriegsfolgen, der Spaltung unseres Landes (und damit seiner Redaktion) sowie den wachsenden Sprachproblemen zum Opfer gefallen: Es wurden von den seit 1907 in den USA erscheinenden Chemical Abstracts überholt und mußte 1969 eingestellt werden. Gegen Ende der fünfziger Jahre zeichnete sich das exponentielle Wachstum des chemischen Wissens immer deutlicher ab. So gut die Chemieliteratur auch durch Referateorgane, Handbücher und Register erschlossen sein mochte: Der einzelne Chemiker mußte einen immer schneller wachsenden Teil seiner Zeit mit dem Aufsuchen einschlägiger Literatur verbringen, wenn er dem alten Grundsatz wissenschaftlicher Arbeit treu bleiben wollte, die einschlägigen Quellen zu suchen und zu nennen, und wenn er der Gefahr entgehen wollte, die Räder immer wieder neu erfinden zu müssen. Er brauchte dringend weitere Hilfen.

Zunächst behalf man sich mit einfachen Mitteln zur mehrdimensionalen Recherche, d.h. zur kombinierten Suche nach mehreren Begriffen gleichzeitig (mit Double-Dictionaries und mit Schlitz-, Sicht- und Maschinenlochkarten). Aber schon nach wenigen Jahren erwiesen sich auch diese Werkzeuge als unzureichend. Gerade noch rechtzeitig tauchte jedoch ein Retter in der Not auf: Der Computer. Für ihn waren die "harten" chemischen Begriffe leichter verdaulich als die anderer, mit Sprach- und Terminologie-Problemen stärker belasteter Disziplinen. Das hatte zur Folge, daß neue Methoden hier rascher entwickelt und quasi am Modell erprobt werden konnten, die später auch anderen Fachrichtungen zugute kamen. Anfangs tauchte freilich eine spezielle Schwierigkeit auf, die schwer überwindbar schien. Das wichtigste Planungs- und Verständigungsmittel vor allem in der organischen Chemie ist die Sprache der Strukturformeln, und sie konnte durch verbale und klassifikatorische Hilfsmittel nur sehr unzureichend oder umständlich abgebildet werden. Ganz neuartige Ideen und Methoden waren hier nötig, um die Fragestellung des Chemikers ausreichend flexibel und präzise zum Ausdruck bringen zu können. An dieser Stelle mußte also der Hebel wohl zuerst angesetzt werden, und aus dieser Entwicklung möchte ich - der Intention dieses Buches folgend - einige persönliche Reminizenzen (1) zum besten geben, quasi aus der Bronzezeit der Dokumentation, wenn man das Arbeiten ohne Computer etwas arrogant als steinzeitlich bezeichnen darf. Man möge mir verzeihen, wenn ich die Geschehnisse dabei sehr aus meiner eigenen Sicht und der unserer Arbeitsgruppe schildere.

1958, als ich noch in der Küpenfarbstoff-Forschung arbeitete, erhielt ich den Auftrag, die Farbstoff-Dokumentation mit Hilfe von Hollerithkarten zu verbessern. Für das Pharma-Gebiet gab es damals schon ein entsprechendes Fragment-Verfahren zur Struktur-Verschlüsselung von W. Steidle (2) (der zu jener Zeit bei Thomae tätig war), aus dem später der weitverbreitete RINGDOC-Code hervorging. Einen zukunftssicheren Fragmentcode für die Farbstoffe aufzustellen, schien mir aber ziemlich hoffnungslos; gerade waren die Reaktiv-Farbstoffe aufgekommen und hatten gezeigt, daß plötzlich Fragmente wichtig werden können, die vorher uninteressant zu sein schienen, und so etwas konnte jederzeit wieder passieren.

Damals kam mir gerade eine Arbeit aus dem National Bureau of Standards (NBS) (3) in die Hände, in der Strukturformeln topologisch durch Verknüpfungstafeln codiert wurden: Die Atome werden in beliebiger Reihenfolge numeriert, und für jedes gibt man in einer Zeile der Matrix ("Connection Table") neben seinem Elementsymbol die Nummern der mit ihm verbundenen Nachbaratome und die entsprechenden Bindungstypen an.)

So würde man daher später nach beliebigen Substrukturen suchen können, und das faszinierte mich ebenso wie die Einfachheit der Codierungsregeln.

(Zuerst vorgeschlagen war diese Methode übrigens als ZATOPLEG- Verfahren schon 1951 von Calvin N. Mooers (4), der sie aber nicht programmiert hatte.) Der Werkstudent der Astronomie L.C. Ray, der die Programme geschrieben hatte, verließ das NBS bald, und die Sache schlief wieder ein. Die Codierung der Formeln von Hand war auch viel zu aufwendig und fehleranfällig. Bald danach las ich eine andere Arbeit von Ascher Opler (5) (Dow Chemical Corp.), der ebenfalls Strukturformeln topologisch codierte; um die Einspeicherung praktikabel zu machen, zerlegte er sie aber nicht in Einzelatome, sondern nur in größere Fragmente wie Ringe, Harnstoff-Gruppierungen etc. (er konnte dann allerdings auch nicht nach beliebigen Substrukturen, z.B. Teilen dieser Fragmente suchen). Aber auch diese Methodik starb bald.

Ich wollte nun die Vorzüge beider Verfahren vereinigen, indem ich Oplers Fragmente maschinell in die Einzelatome wie bei Ray und Kirsch auflöste (6). Von Computern wußte ich damals nicht mehr, als daß sie nach einem Programm arbeiteten, Zahlen vergleichen und je nach Ergebnis an andere Stellen des Programms springen konnten. Das genügte aber, um die vielfältigen Möglichkeiten zu erkennen oder zu erahnen, die sich aus der topologischen Strukturcodierung ergaben. Bei der Eingabe nach Opler mußte man viel addieren, und weil es damals noch keine elektronischen Taschenrechner gab, baute ich mir zunächst eine spezielle mechanische Addiermaschine, bei der man mit einer Einstellung leicht mehrere der benötigten Summen ablesen konnte. Mit ihrer Hilfe codierten wir dann 1000 Strukturformeln, und ich fand auch einen Mathematiker, der die entsprechenden Computerprogramme schrieb. 1959 führten wir dann die ersten erfolgreichen Substrukturrecherchen durch, und zwar in Paris, weil die erste Anlage der BASF noch nicht installiert war. Dabei zeigte sich, daß die Recherchekosten viel zu hoch lagen; und auch die Formelcodierung war noch viel zu aufwendig und fehleranfällig. Es wurde uns klar, daß man bei der Recherche Vorselektionsstufen einschalten mußte, um nur einen Bruchteil der Formeln Atom für Atom nachprüfen zu müssen. Zur Vorauslese bot sich ein Fragmentcode an, den man aus der topologischen Codierung automatisch erzeugen mußte, sonst wäre die Doppelverschlüsselung der Formeln zu teuer und fehleranfällig geworden. Aber grundsätzlich mußte ja die automatische Erzeugung beliebiger Codes möglich sein, weil die topologische Codierung den vollen Informationsgehalt der Struktur bewahrte. Für die topologische Eingabe hätten wir - da es ja noch keine Bildschirmterminals gab - am liebsten die Formeln auf Papier gezeichnet und wenigstens die arbeitsaufwendige Feststellung der Atomverknüpfung der Maschine überlassen. Eine solche Maschine mußte also gebaut werden, aber ich konnte dafür keinen Ingenieur begeistern. So mußte ich die Konstruktionszeichnungen selbst anfertigen, auch die ersten Schaltpläne für die

Elektrotechnik (damals noch mit Relais und Thyratrons). Aber dann fand ich einen Schlosser und einen Elektrotechniker, die mit mir einen Prototyp zusammenbastelten. Als der tatsächlich funktionierte, ließen sich dann auch leicht Ingenieure finden, und wir bauten eine zweite, komfortablere Maschine (7). Inzwischen hatten die Farbwerke Hoechst (jetzt Hoechst AG) uns eingeladen, ihr GREMAS-System (8) anzuschauen und näher kennenzulernen, das ebenfalls mit einem Computer arbeitete, wenn auch noch auf Basis eines klassifikatorischen Fragmentcodes. Nach einem GREMAS-Kurs 1962 fiel dann die Entscheidung über eine Zusammenarbeit der drei großen deutschen Chemiefirmen, aus der 1967 die IDC Internationale Dokumentationsgesellschaft für Chemie mbH. hervorging. Zwar hielten wir - besonders im Literaturbereich - die topologische Methode für zukunftssicherer, aber sie war noch in Entwicklung, während Hoechst schon ein arbeitsfähiges Verfahren vorweisen konnte. Daß selbst eine so große Firma wie die BASF die Patent- und Literatur-Dokumentation der Chemie nicht mehr allein würde bewältigen können, zeichnete sich damals bereits ab, und die Gelegenheit zur Zusammenarbeit mußte genutzt werden. Darüber hinaus konnte man auch beide Methoden miteinander kombinieren: Topologisch nachselektieren, wo GREMAS nicht zielsicher genug war, bzw. GREMAS als Fragmentscreen vor der topologischen Recherche benutzen (9).

Also beteiligten wir uns, ebenso wie Bayer, an der GREMAS-Codierung des Leverkusener Fortschritts- und des Hoechster Patent-Berichts. Daneben aber entwickelten wir Programme zur vollautomatischen Generierung der GREMAS- aus der topologischen Strukturcodierung. Hoechst hatte uns angeboten, auch Recherchen für uns durchzuführen, aber wir wollten lieber unsere eigene, leistungsfähigere Anlage benutzen und schrieben Programme für die IBM 709. Als 1964 dann die ersten GREMAS-Recherchen bei uns liefen, erlebten wir einen Schock: wir hatten uns darauf verlassen, daß die größere Maschine auch billiger arbeiten würde, und hatten nicht bedacht, daß eine Wortmaschine für GREMAS weniger geeignet war als die Hoechster Byte-Anlage: Zehn Anfragen über ein Zehntel des damaligen Speichers verursachten 2.000 DM Maschinenkosten. 2.000 DM pro GREMAS-Anfrage, das war indiskutabel. In schlaflosen Nächten überlegte ich, wie ich unserem Forschungsleiter schonend beibringen könnte, daß nach anderthalb Jahren gemeinsamer Input-Arbeit die Zusammenarbeit wieder aufgekündigt werden müßte.

Wir bereiteten damals eine Studienreise in die USA vor, wo inzwischen auch der Chemical Abstracts Service (CAS) sich mit topologischer Strukturcodierung für sein Registry-System beschäftigte (10).Unter vielen Gewissensbissen beschloß ich deshalb, meinen Canossagang bis zur Rückkehr aufzuschieben, und das erwies sich als richtig. Denn auf dieser Reise konnte ich nicht nur Verbindungen anknüpfen, aus denen später eine enge Zusammenarbeit der BASF - schließlich auch der IDC - mit dem Chemical Abstracts Service erwuchs; ich lernte bei einem Lunch in Philadelphia auch den Vater der topologischen Strukturformel- Verschlüsselung, Calvin Mooers, persönlich kennen und wurde auf einen zweiten Geistesblitz von ihm aufmerksam: Auf sein ZATOCODING-Verfahren der Überlagerungscodierung (11), das er für Randlochkarten empfohlen hatte. Es erlaubt, ein sehr großes Codevokabular auf einen relativ kurzen Bitstring abzubilden, wobei zwar Ballast anfallen, aber kein Verlust entstehen kann. Diese Methode ließ sich sicher auch auf den Computer übertragen und gerade auf Wortmaschinen sehr wirksam einsetzen, speziell für Screening-Zwecke (12). Nach meiner Rückkehr gingen wir also fleißig ans Werk, und tatsächlich konnten wir durch den GREMAS-Überlagerungs-Screen bald die Maschinenkosten auf der IBM 7090 um den Faktor 20 senken. Kosten von 100 DM pro Recherche ließen sich schon eher tragen, und so war die Zusammenarbeit gerettet. Ohne diesen Trick hätten die IDC - wenn sie überhaupt gegründet worden wäre - und ihre Gesellschafter für Recherchen viele Millionen DM mehr an Maschinenkosten aufwenden müssen.

Unsere Entwicklungsarbeit ging aber weiter. Für einen Farbstoffchemiker war es besonders ärgerlich, daß GREMAS bei den Farbstoffen unbefriedigende Ergebnisse brachte. Bei den Cassella Farbwerken und in unserem eigenen Farbenlabor waren deshalb speziell für Reaktiv-Farbstoffe schon andersartige Konzeptionen mit überlappenden Fragmenten entwickelt worden. Auch ein solcher Code mußte sich - ähnlich wie uns das schon bei GREMAS gelungen war - aus der topologischen Codierung automatisch erzeugen lassen. Experten der großen deutschen Farbenhersteller haben dann in vielen Klausursitzungen einen sehr leistungsfähigen Code entwickelt, und unter Mitwirkung unseres Computer-Virtuosen Ehrhard Sens, der auch schon die GREMAS-Erzeugung programmiert hatte, entstand ein leistungsfähiges Gesamtsystem, das auch nach fast zwei Jahrzehnten noch keine grundlegenden Žnderungswünsche hat aufkommen lassen. Da dabei die Struktureingabe, auch die von Markush-Formeln mit variablen Resten, ausschließlich topologisch erfolgt, kann man obendrein im Bedarfsfall immer zielsicher nachrecherchieren(13).

Die Leistungsfähigkeit der topologischen Codierung war damit noch längst nicht ausgeschöpft. Nicht nur, daß verschiedene solche Codes maschinell wechselseitig ineinander umgewandelt werden können - wir programmierten u.a. die Erzeugung unseres Formats aus dem von Chemical Abstracts und schufen damit die Grundlage der Zusammenarbeit zwischen CAS und IDC - , und daß es bald auch für den oben erwähnten RING-Code schon Erzeugungsprogramme gab (14); auch Manipulationen an Strukturformeln, die chemische Reaktionen simulieren, lassen sich so vornehmen. Wir entwickelten für unsere Formellesemaschine eine entsprechende Eingabemethode für chemische Reaktionen (15), und auf solcher Basis schuf R. Fugmann in Hoechst sein TOSAR-System zur Abbildung und Recherche der syntaktischen Begriffszusammenhänge im Dokument (16). Damals erschien die Eingabe der chemischen Reaktionen zwar noch zu teuer, aber in den letzten Jahren hat sie eine weltweite Blüte erlebt; die IDC freilich hatte schon viele Jahre vorher einen vorzüglichen Reaktionenspeicher auf GREMAS-Basis aufgebaut.

Auch für ein chemisches Experten-System, das vermutlich größte und leistungsfähigste im zivilen Bereich, war eine solche topologische Struktur-Codierung und Manipulation unerläßlich. Aufbauend auf Arbeiten und Programmen von E.J. Corey und W.T. Wipke (17) schuf eine Arbeitsgemeinschaft der meisten großen europäischen Chemiefirmen ein System zur computergestützten Syntheseplanung (CASP = Computer-assistierte Synthese-Planung), in das in Form topologischer Reaktionstypen- Beschreibung ein sehr beträchtlicher Teil des organisch-präparativen Wissens einfloß, sehr viel mehr, als selbst ein guter Chemiker ständig im Gedächtnis halten kann.

Mit dem Aufkommen der Time-Sharing-Computer und dem Preissturz bei den Plattenspeichern wurde sogar die Online-(sub-)strukturrecherche im größten Strukturformelspeicher (dem Chemical-Abstracts-Registry-File, CARF) möglich, die in CAS-online und DARC (18) seit einigen Jahren auch öffentlich angeboten wird. Die Arbeit des Chemikers wird dadurch rationalisiert, vor allem weil er sich nicht mehr mit Formelregistern und mit der systematischen Nomenklatur abplagen muß, sondern seine Fragen in der ihm vertrauten Strukturformelsprache stellen kann. Unseren BASF-Chemikern konnten wir so etwas schon etliche Jahre früher bieten; lediglich Substrukturrecherchen im CARF waren wegen des zu hohen Plattenspeicherplatz-Bedarfs aus Kostengründen nicht online im Hause durchzuführen.

Chemisches Wissen (mit Schwerpunkt bei den Strukturformeln) ist in öffentlich zugänglichen Datenbanken bisher meist nur als Literaturnachweis verfügbar. Beim Gmelin- und Beilstein- Institut sind aber - mit Unterstützung des Bundesministers für Forschung und Technologie - jetzt auch Faktendatenbanken im Aufbau. Mit ihrer Hilfe wird der Chemiker benötigte Informationen über Herstellung und Eigenschaften bekannter Stoffe auch direkt abrufen können, ohne immer den Weg über Referate und Originalliteratur gehen zu müssen. Sie werden einen weiteren wichtigen deutschen Beitrag zur internationalen Chemie-Dokumentation leisten. Die topologische Strukturformelcodierung hat sich inzwischen allgemein durchgesetzt, weil ihre Regeln so einfach sind, daß auch der Laborchemiker sie rasch akzeptiert, und weil sie dennoch den vollen Informationsgehalt der Strukturformel bewahrt und nutzbar macht. Anders als bei der Volltextrecherche gibt es praktisch kein Synonymenproblem und daher 100% Recall ohne Ballast bei beliebigen Stoffklassen, Reaktionen und Synthesewegen, soweit diese über Strukturen eingespeichert sind. Das ist vor allem der klar definierten, international einheitlichen Formelsprache der Chemie zu verdanken; die anfängliche Schwierigkeit, die Strukturen computergerecht zu codieren, konnte überwunden werden, und die dafür entwickelten Methoden strahlten sogar auf andere Disziplinen aus. Speziell die Organiker, einschließlich der Farbstoff-und Wirkstoff-Chemiker, denken seit Kekule vorwiegend in Strukturformeln; sie assoziieren mit Substrukturen auch chemische, physikalische und biologische Eigenschaften der Stoffe. Strukturen auf dem Computer handhaben zu können, war deshalb unser Traum, seit wir von elektronischer Datenverarbeitung hörten. Seine Erfüllung konnte und kann der Chemiker von vielen Routinearbeiten entlasten und ihm mehr Zeit und Raum für kreative Gedanken geben.

Durch die Flexibilität der Moleküle, vor allem infolge der freien Drehbarkeit um Einfachbindungen, ist die Molekülstruktur eine topologische - im Gegensatz zur topographischen Kristallstruktur, bei der die Koordinaten aller Atome weitgehend fixiert sind. Aber auch zwischen diesen beiden Welten konnte der Computer eine Brücke bauen. Im Molecular Modeling, das Bindungslängen und -winkel sowie elektrische und andere Wechselwirkungen zwischen den Atomen berücksichtigt, kann man biegsame, raumerfüllende Modelle aus der topologischen Darstellung aufbauen und an biologische Rezeptoren anpassen lassen, oder umgekehrt Informationen über die Gestalt und Wirkungsweise dieser Rezeptoren gewinnen. So kommt man auch den Kausalbeziehungen biochemischer Wechselwirkungen immer näher.

Sogar bei der Entdeckung neuer Wirkstoffklassen konnte die Weiterentwicklung der topologischen Methoden uns helfen (19). Wir benutzen sie, um "Datenfriedhöfe" biologischer Testergebnisse systematisch auf noch unentdeckte Wirkstoffklassen und "Pharmakophore" (d.h. Substrukturen, die solche Klassen charakterisieren) zu untersuchen: Aus ca. 100 000 Strukturformeln biologisch geprüfter Verbindungen erzeugten wir 120 000 Fragmente, die in jeweils mehr als 15 Formeln vorkamen; nach Ausscheiden der bereits erkannten Wirkstoffklassen ermittelten wir statistisch, welche dieser Fragmente signifikant häufiger (in wirksamen als in unwirksamen Präparaten vorkamen (bei starker Wirkung war die Wirkung sicher bereits erkannt): Hier erwies sich die langjährige topologische Dokumentation unserer Strukturformeln, kombiniert mit der EDV-Speicherung der Testergebnisse, als Fundgrube für weitere Entwicklungen im Pflanzenschutz. Als interessantes Nebenprodukt dieser Arbeiten konnten wir unseren Wirkstoffchemikern sogar noch ein Dialogverfahren zum Blättern im gesammelten Datenmaterial zur Verfügung stellen, mit dem sie sich u.a. Fragment-Stammbäume ganzer Wirkstoff- klassen aufbauen können. Mit ihrer Hilfe kann man erkennen, welche Bereiche des "chemischen Raums" einer Klasse vielversprechend sein könnten, aber im Hause noch wenig untersucht sind.

Topologische Dokumentationsmethoden haben uns also in der organischen Chemie ein gutes Stück weitergebracht. Ihre Entwicklung bei den Strukturen - quasi als Modellfall - war in unserem Fachgebiet dadurch begünstigt, daß wir es hier zunächst mit einer begrenzten Zahl von Atomarten und Bindungstypen zu tun hatten. Diese Methoden haben dann aber auch andere Bereiche und Disziplinen eingewirkt: nicht nur, daß man beispielsweise im Automobilbau Getriebetypen und Achsaufhängungen, topologisch darstellen konnte, auch andere Schemata sind dadurch der Handhabung mit dem Computer zugänglich geworden. Schon im IDC-Thesaurus (20) konnten wir, ähnlich wie ein Molekül mit Atomen und Bindungen, unser ganzes Begriffssystem mit den nichtstrukturellen Begriffen und ihren semantischen Beziehungen topologisch computergerecht darstellen, quasi als Superstruktur unserer Begriffswelt. (Unsere Programme hierfür wurden übrigens von den zentralen Dokumentationsstellen des Automobil- und Maschinenbaus sowie der Elektrotechnik übernommen). Eine andere Anwendung für die Syntax der Begriffe im einzelnen Dokument haben wir als TOSAR-System bereits erwähnt. Für die Syntax der logisch besonders schwierigen und möglichst exakt abzubildenden Patente haben M.F. Lynch und Mitarbeiter (21) in England ein sehr leistungsfähiges topologisches Codierungssystem mit einer speziellen Beschreibungssprache ("GENSAL") geschaffen. Eine weitere wichtige Entwicklung steht freilich noch aus: Die Abbildung unseres Wissens über das biochemische Stoffwechselgeschehen (22) mit den daran beteiligten Substraten, Enzymen, Regulatoren und Reaktionen. Diese Zusammenhänge, selbst die, die als gesichert anzusehen sind, können heute nämlich auf Metabolismus-Karten (wie der bekannten von Boehringer-Mannheim (23)) längst nicht mehr vollständig und übersichtlich dargestellt werden. Eine topologische Darstellung im Computer würde es erlauben, nach fast beliebigen Gesichtspunkten zusammengestellte Auszüge daraus übersichtlich auf dem Bildschirm zu präsentieren und damit der Biochemie wie der Medizin neue Einblicke und Fragemöglichkeiten zu eröffnen. (Einige Beispiele: Auf welche Enzyme wirkt die Stoffklasse A hemmend? Welche Vor- bzw. Folgeprodukte [bis zu n Stufen] und welche Enzyme sind an Fumarsäure- Stoffwechsel beteiligt, welche Regulatoren wirken dabei mit? Welche der einschlägigen Reaktionen verbrauchen Adenosin-Triphosphat? Wo wirkt Fumarat als Enzymregulator? Welche Regulatoren wirken auf das Enzym XYZ ein? Bei welchen Reaktionen spielt dieses Enzym eine Rolle? Welche Enzyme und Regulatoren wirken beim Auf-bzw. Abbau von Körperfett mit? usw.) Die Erkennung von Syndromen, wie auch viele Krankheitsdiagnosen und -behandlungen, könnten dadurch wesentlich erleichtert werden. Schon mit gebräuchlichen Expertensystem-Shells könnten man hier einiges erreichen, viel mehr natürlich mit einem speziellen Programmsystem unter Einbeziehung der graphischen Darstellungsmöglichkeiten des Computers. Der Input-Aufwand ist freilich groß, ähnlich wie bei der Speicherung des chemischen Wissens für die Syntheseplanung, und von einem einzelnen Institut oder einer Firma wäre er wohl kaum zu tragen; eine Zusammenarbeit, wie in anderen Bereichen der Dokumentation, läge nahe. Ein kommerzieller Erfolg damit dürfte zwar kaum kalkulierbar sein; für die Wissenschaft und das Wohlergehen der Menschheit wäre der Gewinn aber sicher groß.

Mit den hier beschriebenen Anwendungen sind die Möglichkeiten, die durch die topologischen Methoden der Dokumentation erschlossen werden können, sicher noch keineswegs erschöpft, sie können sich auch in anderen Bereichen und Fachgebieten als sehr nützlich erweisen. Unser Wissensschatz wächst in vielen Disziplinen so rasch, daß Klassifizierung und Schlagwort-Recherche auch außerhalb der Chemie bald nicht mehr ausreichen werden: Die Strukturen, beispielsweise von Semantik und Syntax, wird man bald auch anderswo mit Computerhilfe erschließen müssen, um in der Dokumentation Anfragen flexibel und zielsicher bearbeiten zu können. Die Chemie hat hierfür wichtige Modell- und Pionierarbeit geleistet.

Die topologische Methodik ist hier, besonders für die Darstellung und Handhabung von Strukturformeln, längst zum gängigen Werkzeug geworden, ähnlich wie vor hundert Jahren der Gebrauch von Strukturformeln und wie heute der Computer selbst. Trotz aller Analysen, Überlegungen und Vorahnungen hätten wir uns dieses Ausmaß vor 25 Jahren noch nicht vorstellen können. Und die Entwicklung geht immer noch in atemberaubenden Tempo weiter.

Meinen Kollegen und Mitarbeitern, besonders den Herren Ehrhard Sens und Peter Schilling, die in mehr als zwei Jahrzehnten die meiste Programmierarbeit leisteten und viele brilliante Ideen beisteuerten, möchte ich auch an dieser Stelle nochmals herzlich danken.

Anmerkungen:

  1. Ernst Meyer, Tagungsbericht über die 1. Vortragstagung der GDCh-Fachgruppe "Chemie-Information" in Frankfurt, am 27.(28.10.83 (ISBN 3-924763-00-3)
  2. W. Steidle, Pharm. Ind.19 (1957), 88-93
  3. L.C. Ray und R.A. Kirsch, Science 126 (1957), 814-819; NBS-Report No. 5115 (1956)
  4. C.N. Mooers, Zator Technical Bulletin 59 (1951), 1-8
  5. A. Opler und T.R. Norton, Chem. and Eng. News 34 (1956), 2812-2816
  6. E. Meyer und K. Wenke, Nachr. für Dokumentation 13 (1962), 13-19
  7. E. Meyer, Nachr. für Dokumentation 13 (1962), 144-146
  8. R. Fugmann, Proc.IUPAC Congr.1959, 331-341; W. Braun, R. Fugmann und W. Vaupel, Angew. Chemie 73 (1961), 745-751
  9. E. Meyer, J. Chemical Documentation 9 (1969), 109-113
  10. W.E. Cossum, M.L.Krakiwsky und M.F. Lynch, Am.Chem.Soc. Meeting, Philadelphia, April 1964
  11. C.N.Mooers, Amer. Documentation II (1951), 20-32;ASLIB Proceedings 8 (1956) 3-21
  12. E. Meyer in "Mech.Inf.Stor.Retr. and Dissemination", Proc. of the FID-IFIP Conference (Rom 1967), 280-288 (ed.by K. Samuelson, North Holland Publ.Comp.1968)
  13. E. Meyer, Proc. of Conf.on Computer-Handling of Generic Chemical Structures, Sheffield 1984, (ed. by J.M. Barnard, Gower Publ.Comp.1984), pp.82-95
  14. U. Klingebiehl und K. Specht, J. Chem. Inf. Comp.Science 20 (1980), 113-116
  15. E. Meyer, Am.Doc.Inst., 26th Annual Meeting, Chicago 1963, 131-132; Angew. Chemie 77 (1965), 340-345
  16. R. Fugmann H. Nickelsen, I. Nickelsen und J. Winter, Angew. Chemie 82 (1970), 611-618
  17. E.J. Corey und W.T. Wipke, Science 166 (1969), 178-192
  18. J.E. Dubois, Bull.Soc.chim.Fr., 1968, p.900-904; J.Chem. Inf. Comp.Sci. 24 (1984), 241-249; R. Attias, J.Chem. Inf. Comp.Sci. 23 (1983), 102-108
  19. E. Meyer und E. Sens, Proc. VIIIth ICCCRE, Beijing 1987, Analytica Chimica Acta (im Druck); Proc. of Conf. on Chemical Structures, Leeuwenhorst 1987, (ed.by W.A. Warr, im Druck)
  20. E. Meyer, R. Jansen und E. Sens, Nachr. für Dokumentation 23 (1972), 203-211
  21. M.F. Lynch, J.M. Barnard und S.M. Welford, J. ChemInf.Comp. Sci. 21 (1981), 148-168; 22 (1982), 160-164
  22. E. Meyer, Proc.of VIIth ICCCRE, Garmisch-Partenkirchen 1985
  23. G. Michal, "Biochemical Pathways", Second Printing 1976, Boehringer Mannheim GmbH


Copyright: Thomas Hapke, 30.1.2006
URL of this Page: http://www.tu-harburg.de/b/hapke/ispg/meyer-doc.htm


back to "History of Scientific (Scholarly) Information and Communication" page