Zusammenfassung
In den bisherigen Kapiteln wurde das Informationsverarbeitungs-Paradigma der Kognitionswissenschaften erläutert und gezeigt, wie Information mit Hilfe von realisierten Algorithmen verarbeitet werden kann. Da die symbolische Informationsverarbeitung lange Zeit die einzig zur Kenntnis genommene Möglichkeit der Informationsverarbeitung darstellte, ging man davon aus, daß die kognitiven Leistungen des Menschen ebenfalls aus dem Wirken einer symbolischen Informationsverarbeitung resultieren müßten. Konsequenterweise wurde — in Analogie zu der Maschinensprache eines Computers — eine “Sprache des Geistes” postuliert, in der das menschliche Gehirn propositionale Einstellungen “berechnet”. Diesen Versuch einer Erklärung propositionaler Einstellungen mit Hilfe einer symbolischen Informationsverarbeitung (Symbolismus) habe ich im letzten Kapitel am Beispiel von Jerry Fodor’s “Representational Theory of Mind” dargestellt und kritisiert.
“If you don’t know why certain things happen then invent a mechanism (in accordance with the view you take of how the world works) — but it is better still if you find out how nature really works.”
Rom Harré
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Eine umfassende Anthologie zur Geschichte konnektionistischer Systeme wurde von Anderson and Rosenfeld (1988) zusammengestellt.
In der erweiterten Neuauflage von Perceptrons (1988; xxiii) weisen Minsky und Papert auf diese Mißinterpretation ihrer Arbeit selbst hin.
Im Gegensatz dazu ist es bei “Feed-back”- oder “interaktiven” Netzwerken möglich, daß eine Einheit einer bestimmten Ebene ein Signal auf eine Einheit der gleichen oder einer untergeordneten Ebene überträgt, daß also z.B. der Aktivierungszustand einer inneren Einheit den Zustand einer Input-Einheit beeinflußt.
Genau wie der Wert, den ein Thermometer anzeigt, eine durch Ziffern darstellbare numerische Größe ist, ohne daß das Thermometer Symbole manipuliert. •
Von der Beantwortung dieser Fragen erhofft man sich natürlich auch, Aufschluß über die funktionale Organisation des Gehirns zu gewinnen. Dabei wird oft stillschweigend davon ausgegangen, daß die morphologische Organisation des Gehirns seine funktionale Organisation widerspiegelt.
Thagart (1989) versucht beispielsweise mit Hilfe von konnektionistischen Systemen, die Auswahl verschiedener konkurrierender Hypothesen in wissenschaftlichen Gemeinschaften zu simulieren.
Wenn in diesem Abschnitt von In-bzw. Output die Rede ist, geht es immer um den lokalen In-bzw. Output, also um den Input, den die einzelne Recheneinheit von anderen Einheiten (bzw. als Teil des globalen Inputs) erhält, und den Output, den sie auf andere Recheneinheiten überträgt (oder einen Teil des globalen Outputs darstellt).
Als”Quasi-linear” wird eine Schwellenwertfunktion (und alle folgen deterministischen Funktionen) deshalb bezeichnet, weil-obwohl nicht linear-dennoch gilt, dab ein groberer Input doch zu einem groberen Aktivierungswert fuhrt.
Dieser Punkt wird beim Vergleich symbolischer und konnektionistischer Informationsverarbeitung eine wichtige Rolle spielen.
In der Mathematik ist es üblich, zuerst den Vektorraum als eine Menge von Elementen zu definieren, die u.a. die oben genannten Bedingungen erfüllen, und Vektoren dann als Elemente dieses Vektorraums einzuführen. Ich bin hier den umgekehrten Weg gegangen, was aber nicht weiter stören sollte. Auch im folgenden werde ich keinen Wert auf mathematische Vollständigkeit und Strenge legen, sondern der Anschaulichkeit den Vorzug geben.
Um eine Vorstellung von den in der Forschung tatsachlich verwendeten zustandstraume zu geben:Ritter (1989) verwendete bei der Simulation der somatotopischen reprasentation der handoberflacheein gitternetzwerk (Kohonen-Netz) mit 128*128 Recheneinheiten.Daraus ergibt sich ein 16.384-dimensionaler zustandsraum.
Die Multiplikation eines Vektors mit einer Matrix möchte ich hier nicht ausführen. Für Interessierte verweise ich auf Jordan (1986). Dort werden die Begriffe und Operationen der linearen Algebra im Hinblick auf die Anwendung bei konnektionistischen Systemen in nicht-technischer Weise dargestellt.
Entsprechendes gilt für Einheiten mit mehreren Aktivierungszuständen oder einem Aktivierungskontinuum: Ein hohes positives Verbindungsgewicht von A nach B besagt, daß bei hohem Aktivierungszustand von A der Aktivierungszustand von B auch hoch sein sollte.
Das oben erwähnte Netzwerk von Ritter (1989) ist - so gesehen - ein System, das versucht, gleichzeitig mehr als 13 Millionen (flexibler) Bedingungen Rechnung zu tragen. Das von Ritter benutzte Netzwerk dürfte zwar zu den größten gegenwärtig untersuchbaren Netzwerken zählen, man stelle sich daneben aber - wenn möglich - das entsprechende deduktive Regelsystem vor.
Dieser hier intuitiv eingeführte Begriff des stabilsten oder harmonischsten Zustands eines Netzwerks kann auf relativ einfache Weise mathematisch präzisiert werden: man vergleicht (für alle Einheiten) die tatsächlichen Aktivierungswerte zweier Einheiten mit den Werten, die durch die Verbindungsgewichte eigentlich verlangt werden. Daraus ergibt sich ein Maß für die Harmonie des Netzwerks (cf. Smolensky 1986 ).
Das folgende gilt im Prinzip für alle konnektionistischen Systeme, allerdings wird nur es im Zusammenhang mit dynamischen Systemen, also Systemen, bei denen sich der Verarbeitungsvorgang über eine ganze Serie von Zeitpunkten erstreckt, besonders deutlich. Für einfache Systeme schrumpft diese Serie oft auf die zwei Endpunkte: den Zeitpunkt des Inputs und den des Outputs.
Zu jedem möglichen Input gibt es genau einen stabilen Zustand des gesamten Netzwerks. Natürlich muß es unterschiedliche stabile Zustände geben (und damit verschiedene Outputs), sonst wäre das ganze Netzwerk witzlos.
Es ist überhaupt eine interessante Tatsache, daß die mathematischen Formalismen zur Beschreibung konnektionistischer Systeme im wesentlichen denen der Thermodynamik entsprechen. Sollten sich konnektionistische System als geeignete Erklärungsmodelle der menschlichen Informationsverarbeitung herausstellen, hieße das, daß die menschliche Informationsverarbeitung mit den formalen Mitteln der Thermodynamik beschreibbar wäre, bzw. auf diese reduziert werden könnte.
Verschiedene Vektoren eines Vektorraums bilden einen Winkel untereinander (wie man sich im zweidimensionalen Raum leicht klarmachen kann). Zwei Vektoren sind ähnlich (relativ zu einem dritten), wenn der Winkel zwischen den beiden Vektoren kleiner ist als zum dritten. Damit ist eine exakte Definition der Ahnlichkeit von Vektoren möglich.
Damit soll nicht impliziert werden, daß der Prozeß, mit dem die Person zu der geforderten Klassifizierung gelangt, identisch ist mit dem Prozeß, der im konnektionistischen System abläuft.
Obwohl das Verhalten dieser Netzwerke äußerst interessant ist, möchte ich hier nicht näher darauf eingehen. Für eine gute Darstellung der Mechanismen des konkurrierenden Lernens und einiger interessanter Anwendungen siehe z.B. Rumelhart and Zipser 1986.
Das wohl am häufigsten angeführte Beispiel ist das XOR-Problem, bei dem es darum geht, die Wahrheitstafel des “ausschließenden oder” zu erlernen (cf. Rumelhart, Hinton and McClelland 1986; 63 ).
Diese methodengeleitete Foschungsstrategie wird mitunter scharf kritisiert (cf. z.B. Lehnert 1988; 40).
Die inneren Vektoren sind Punkte in einem Vektorraum (der eine Hyperebene im Vektorraum des gesamten Zustandsraums darstellt). Meist untersucht man mit Hilfe einer Clusteranalyse, welche hierarchisch geordneten Gruppen von den Input-Vektoren gebildet werden.
Was als Element des Problembereichs gilt, hängt davon ab, welche Aufgabe das Netzwerk leisten soll.
Bei NETtalk waren die Elemente des Problembereichs beispielsweise Buchstaben und Phoneme.
Das Begriffspaar lautet im Englischen conceptual/ subconceptual. Smolensky, von dem diese Unterscheidung stammt, ist mit den beiden Begriffen selbst nicht glücklich (cf. Smolensky 1988; 3). Am besten ist wohl, sie als termini technici zu verwenden.
Angesichts des Umstands, daß die verwendete Quelle (noch) nicht allgemein zugänglich ist, und angesichts der vagen Charakterisierung dieser Begriffe, habe ich hier ausnahmsweise darauf verzichtet, das Orginal zu übersetzen.
Man beachte, daß es von der jeweiligen Beschreibung eines Problembereichs abhängt, welche Begriffe man verwendet.
Auf alle Fälle ist es eine Frage, die der Forscher lösen muß, bevor er irgendwelche konnektionistischen Systeme arbeiten läßt. Dies ist nicht nur ein Problem des Konnektionismus: Auch im klassischen Symbolverarbeitungsparadigma muß man sich dafür entschieden, welche Zeichen was repräsentieren sollen (und es genügt natürlich nicht, die entsprechenden Zeichen der Alltagssprache mit einem Texteditor in den Speicher zu schreiben).
lnsbesondere J. Katz ist als Verfechter dieser Art semantischer Analyse hervorgetreten (cf. Katz 1967 ), die heute kaum noch verfolgt wird. Man beachte, daß es dabei in erster Linie um eine semantische Analyse der natürlichen Sprache ging. Ob sich deren Ergebnisse - und ihr Scheitern - auf mentale Prozesse übertragen lassen, ist fraglich.
Neben dem oben erwähnten Winkel zwischen zwei Vektoren im Vektorraum, wird oft auch die Distanz zwischen den Punkten betrachtet, die die (normierten) Vektoren im Vektorraum repräsentieren. Beide Ahnlichkeitsmaße sind äquivalent, d.h., sie führen nicht zu unterschiedlichen Ahnlichkeitsbeziehungen zwischen verschiedenen Vektoren.
Fodor selbst bezieht sich mit dieser Äußerung natürlich auf klassische Architekturen.
Hinton, McClelland und Rumelhart (1986; 79) geben ein gutes Beispiel dafür, wie Menschen mit unvollständigen und möglicherweise inkonsistenten Inputs einen bestimmten Gedächtnisinhalt finden: Die meisten wissen sofort, auf wen die Beschreibung “... ist ein Schauspieler, ist intelligent und ist ein Politiker” zutrifft.
Wenn hier von Bedeutung die Rede ist, so ist ein assoziationstheoretischer Bedeutungsbegriff zugrundegelegt und nicht - wie in der traditionellen Logik üblich - ein wahrheitstheoretischer. Hätte der Ausdruck “Idee” nicht so viele unerwünschte Nebenbedeutungen, könnte man sagen, daß Aktivierungsvektoren Ideen repräsentieren (sollen), während Symbole Begriffe repräsentieren. Entsprechend ist die repräsentationale Form von Aktivierungsvektoren eher holistischer bzw. “piktorialer” Natur.
cf. z.B. Goschke and Koppelberg 1988: “... bei distribuierten Repräsentationen ist es zweckmäßig, komplexe Symbole als Aktivierungsmuster über eine große Anzahl von Recheneinheiten zu betrachten, von denen jede evtl. einen Mikrofaktor repräsentiert.”
Fodor bezieht sich mit dieser Aussage nicht auf konnektionistische Systeme.
Durch dieses Zitat wird auch deutlich, warum kognitive Prozesse für sie symbolische Prozesse sein müssen.
Können die einzelnen Recheneinheiten nur zwei diskrete Werte annehmen, läßt sich der Aktivierungsvektor als Folge von Nullen und Einsen darstellen. Etwas problematischer ist es, wenn als Aktivierungswerte alle reellen Zahlen in einem bestimmten Intervall zugelassen sind. Hier könnte davon ausgegangen werden, daß dieses Kontinuum durch eine genügend große Anzahl diskreter Werte hinreichend approximiert werden kann.
Endliche Manipulation diskreter Zeichen ist das Kriterium, das Haugeland (1985) für formale Systeme angibt.
Es hat keinen Zweck, hier auf den Unterschied von deklarativem und prozeduralem Wissen zu verweisen. Auch prozedurales Wissen muß in Form expliziter Regeln repräsentiert sein (cf. Cummins 1986 ).
Aus diesem Grund erfolgt weder in (nicht-programmierbaren) Taschenrechnern, noch in mechanischen Registrierkassen, noch in einem Abacus eine symbolische Informationsverarbeitung. Daß bestimmte Teile oder Zustände etwas repräsentieren (Symbole im normalen, semantischen Sinn sind), bleibt davon unbenommen.
Newell definiert ein Symbolsystem als universelle Maschine (S. 154). Damit etwas eine universelle Maschine sein kann, muß es das Verhalten jeder anderen Maschine simulieren können. Eine notwendige Bedingung dafür ist, daß es Regeln gibt, durch deren Befolgung die universelle Maschine die spezielle Maschine simuliert. Eine Konsequenz daraus ist, daß konnektionistische Systeme keine universellen Maschinen sind.
Genau wie die Prozesse, die dem “Kopf” einer realisierten Turing-Maschine ermöglichen, die Zeichen auf dem Rechenband zu lesen, keine Operationen der (abstrakten) Turing-Maschine sind, sondern nur Fragen der Implementation betreffen.
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 1991 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Helm, G. (1991). Konnektionistische Informationsverarbeitung. In: Symbolische und konnektionistische Modelle der menschlichen Informationsverarbeitung. Informatik-Fachberichte, vol 288. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-10178-0_5
Download citation
DOI: https://doi.org/10.1007/978-3-662-10178-0_5
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-54575-0
Online ISBN: 978-3-662-10178-0
eBook Packages: Springer Book Archive