Konnektionistische Informationsverarbeitung

Helm, Gerhard

doi:10.1007/978-3-662-10178-0_5

Gerhard Helm²

Part of the book series: Informatik-Fachberichte ((2252,volume 288))

50 Accesses

Zusammenfassung

In den bisherigen Kapiteln wurde das Informationsverarbeitungs-Paradigma der Kognitionswissenschaften erläutert und gezeigt, wie Information mit Hilfe von realisierten Algorithmen verarbeitet werden kann. Da die symbolische Informationsverarbeitung lange Zeit die einzig zur Kenntnis genommene Möglichkeit der Informationsverarbeitung darstellte, ging man davon aus, daß die kognitiven Leistungen des Menschen ebenfalls aus dem Wirken einer symbolischen Informationsverarbeitung resultieren müßten. Konsequenterweise wurde — in Analogie zu der Maschinensprache eines Computers — eine “Sprache des Geistes” postuliert, in der das menschliche Gehirn propositionale Einstellungen “berechnet”. Diesen Versuch einer Erklärung propositionaler Einstellungen mit Hilfe einer symbolischen Informationsverarbeitung (Symbolismus) habe ich im letzten Kapitel am Beispiel von Jerry Fodor’s “Representational Theory of Mind” dargestellt und kritisiert.

“If you don’t know why certain things happen then invent a mechanism (in accordance with the view you take of how the world works) — but it is better still if you find out how nature really works.”

Rom Harré

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Eine umfassende Anthologie zur Geschichte konnektionistischer Systeme wurde von Anderson and Rosenfeld (1988) zusammengestellt.
Google Scholar
In der erweiterten Neuauflage von Perceptrons (1988; xxiii) weisen Minsky und Papert auf diese Mißinterpretation ihrer Arbeit selbst hin.
Google Scholar
Im Gegensatz dazu ist es bei “Feed-back”- oder “interaktiven” Netzwerken möglich, daß eine Einheit einer bestimmten Ebene ein Signal auf eine Einheit der gleichen oder einer untergeordneten Ebene überträgt, daß also z.B. der Aktivierungszustand einer inneren Einheit den Zustand einer Input-Einheit beeinflußt.
Google Scholar
Genau wie der Wert, den ein Thermometer anzeigt, eine durch Ziffern darstellbare numerische Größe ist, ohne daß das Thermometer Symbole manipuliert. •
Google Scholar
Von der Beantwortung dieser Fragen erhofft man sich natürlich auch, Aufschluß über die funktionale Organisation des Gehirns zu gewinnen. Dabei wird oft stillschweigend davon ausgegangen, daß die morphologische Organisation des Gehirns seine funktionale Organisation widerspiegelt.
Google Scholar
Thagart (1989) versucht beispielsweise mit Hilfe von konnektionistischen Systemen, die Auswahl verschiedener konkurrierender Hypothesen in wissenschaftlichen Gemeinschaften zu simulieren.
Google Scholar
Wenn in diesem Abschnitt von In-bzw. Output die Rede ist, geht es immer um den lokalen In-bzw. Output, also um den Input, den die einzelne Recheneinheit von anderen Einheiten (bzw. als Teil des globalen Inputs) erhält, und den Output, den sie auf andere Recheneinheiten überträgt (oder einen Teil des globalen Outputs darstellt).
Google Scholar
Als”Quasi-linear” wird eine Schwellenwertfunktion (und alle folgen deterministischen Funktionen) deshalb bezeichnet, weil-obwohl nicht linear-dennoch gilt, dab ein groberer Input doch zu einem groberen Aktivierungswert fuhrt.
Google Scholar
Dieser Punkt wird beim Vergleich symbolischer und konnektionistischer Informationsverarbeitung eine wichtige Rolle spielen.
Google Scholar
In der Mathematik ist es üblich, zuerst den Vektorraum als eine Menge von Elementen zu definieren, die u.a. die oben genannten Bedingungen erfüllen, und Vektoren dann als Elemente dieses Vektorraums einzuführen. Ich bin hier den umgekehrten Weg gegangen, was aber nicht weiter stören sollte. Auch im folgenden werde ich keinen Wert auf mathematische Vollständigkeit und Strenge legen, sondern der Anschaulichkeit den Vorzug geben.
Google Scholar
Um eine Vorstellung von den in der Forschung tatsachlich verwendeten zustandstraume zu geben:Ritter (1989) verwendete bei der Simulation der somatotopischen reprasentation der handoberflacheein gitternetzwerk (Kohonen-Netz) mit 128*128 Recheneinheiten.Daraus ergibt sich ein 16.384-dimensionaler zustandsraum.
Google Scholar
Die Multiplikation eines Vektors mit einer Matrix möchte ich hier nicht ausführen. Für Interessierte verweise ich auf Jordan (1986). Dort werden die Begriffe und Operationen der linearen Algebra im Hinblick auf die Anwendung bei konnektionistischen Systemen in nicht-technischer Weise dargestellt.
Google Scholar
Entsprechendes gilt für Einheiten mit mehreren Aktivierungszuständen oder einem Aktivierungskontinuum: Ein hohes positives Verbindungsgewicht von A nach B besagt, daß bei hohem Aktivierungszustand von A der Aktivierungszustand von B auch hoch sein sollte.
Google Scholar
Das oben erwähnte Netzwerk von Ritter (1989) ist - so gesehen - ein System, das versucht, gleichzeitig mehr als 13 Millionen (flexibler) Bedingungen Rechnung zu tragen. Das von Ritter benutzte Netzwerk dürfte zwar zu den größten gegenwärtig untersuchbaren Netzwerken zählen, man stelle sich daneben aber - wenn möglich - das entsprechende deduktive Regelsystem vor.
Google Scholar
Dieser hier intuitiv eingeführte Begriff des stabilsten oder harmonischsten Zustands eines Netzwerks kann auf relativ einfache Weise mathematisch präzisiert werden: man vergleicht (für alle Einheiten) die tatsächlichen Aktivierungswerte zweier Einheiten mit den Werten, die durch die Verbindungsgewichte eigentlich verlangt werden. Daraus ergibt sich ein Maß für die Harmonie des Netzwerks (cf. Smolensky 1986 ).
Google Scholar
Das folgende gilt im Prinzip für alle konnektionistischen Systeme, allerdings wird nur es im Zusammenhang mit dynamischen Systemen, also Systemen, bei denen sich der Verarbeitungsvorgang über eine ganze Serie von Zeitpunkten erstreckt, besonders deutlich. Für einfache Systeme schrumpft diese Serie oft auf die zwei Endpunkte: den Zeitpunkt des Inputs und den des Outputs.
Google Scholar
Zu jedem möglichen Input gibt es genau einen stabilen Zustand des gesamten Netzwerks. Natürlich muß es unterschiedliche stabile Zustände geben (und damit verschiedene Outputs), sonst wäre das ganze Netzwerk witzlos.
Google Scholar
Es ist überhaupt eine interessante Tatsache, daß die mathematischen Formalismen zur Beschreibung konnektionistischer Systeme im wesentlichen denen der Thermodynamik entsprechen. Sollten sich konnektionistische System als geeignete Erklärungsmodelle der menschlichen Informationsverarbeitung herausstellen, hieße das, daß die menschliche Informationsverarbeitung mit den formalen Mitteln der Thermodynamik beschreibbar wäre, bzw. auf diese reduziert werden könnte.
Google Scholar
Verschiedene Vektoren eines Vektorraums bilden einen Winkel untereinander (wie man sich im zweidimensionalen Raum leicht klarmachen kann). Zwei Vektoren sind ähnlich (relativ zu einem dritten), wenn der Winkel zwischen den beiden Vektoren kleiner ist als zum dritten. Damit ist eine exakte Definition der Ahnlichkeit von Vektoren möglich.
Google Scholar
Damit soll nicht impliziert werden, daß der Prozeß, mit dem die Person zu der geforderten Klassifizierung gelangt, identisch ist mit dem Prozeß, der im konnektionistischen System abläuft.
Google Scholar
Obwohl das Verhalten dieser Netzwerke äußerst interessant ist, möchte ich hier nicht näher darauf eingehen. Für eine gute Darstellung der Mechanismen des konkurrierenden Lernens und einiger interessanter Anwendungen siehe z.B. Rumelhart and Zipser 1986.
Google Scholar
Das wohl am häufigsten angeführte Beispiel ist das XOR-Problem, bei dem es darum geht, die Wahrheitstafel des “ausschließenden oder” zu erlernen (cf. Rumelhart, Hinton and McClelland 1986; 63 ).
Google Scholar
Diese methodengeleitete Foschungsstrategie wird mitunter scharf kritisiert (cf. z.B. Lehnert 1988; 40).
Google Scholar
Die inneren Vektoren sind Punkte in einem Vektorraum (der eine Hyperebene im Vektorraum des gesamten Zustandsraums darstellt). Meist untersucht man mit Hilfe einer Clusteranalyse, welche hierarchisch geordneten Gruppen von den Input-Vektoren gebildet werden.
Google Scholar
Was als Element des Problembereichs gilt, hängt davon ab, welche Aufgabe das Netzwerk leisten soll.
Google Scholar
Bei NETtalk waren die Elemente des Problembereichs beispielsweise Buchstaben und Phoneme.
Google Scholar
Das Begriffspaar lautet im Englischen conceptual/ subconceptual. Smolensky, von dem diese Unterscheidung stammt, ist mit den beiden Begriffen selbst nicht glücklich (cf. Smolensky 1988; 3). Am besten ist wohl, sie als termini technici zu verwenden.
Google Scholar
Angesichts des Umstands, daß die verwendete Quelle (noch) nicht allgemein zugänglich ist, und angesichts der vagen Charakterisierung dieser Begriffe, habe ich hier ausnahmsweise darauf verzichtet, das Orginal zu übersetzen.
Google Scholar
Man beachte, daß es von der jeweiligen Beschreibung eines Problembereichs abhängt, welche Begriffe man verwendet.
Google Scholar
Auf alle Fälle ist es eine Frage, die der Forscher lösen muß, bevor er irgendwelche konnektionistischen Systeme arbeiten läßt. Dies ist nicht nur ein Problem des Konnektionismus: Auch im klassischen Symbolverarbeitungsparadigma muß man sich dafür entschieden, welche Zeichen was repräsentieren sollen (und es genügt natürlich nicht, die entsprechenden Zeichen der Alltagssprache mit einem Texteditor in den Speicher zu schreiben).
Google Scholar
lnsbesondere J. Katz ist als Verfechter dieser Art semantischer Analyse hervorgetreten (cf. Katz 1967 ), die heute kaum noch verfolgt wird. Man beachte, daß es dabei in erster Linie um eine semantische Analyse der natürlichen Sprache ging. Ob sich deren Ergebnisse - und ihr Scheitern - auf mentale Prozesse übertragen lassen, ist fraglich.
Google Scholar
Neben dem oben erwähnten Winkel zwischen zwei Vektoren im Vektorraum, wird oft auch die Distanz zwischen den Punkten betrachtet, die die (normierten) Vektoren im Vektorraum repräsentieren. Beide Ahnlichkeitsmaße sind äquivalent, d.h., sie führen nicht zu unterschiedlichen Ahnlichkeitsbeziehungen zwischen verschiedenen Vektoren.
Google Scholar
Fodor selbst bezieht sich mit dieser Äußerung natürlich auf klassische Architekturen.
Google Scholar
Hinton, McClelland und Rumelhart (1986; 79) geben ein gutes Beispiel dafür, wie Menschen mit unvollständigen und möglicherweise inkonsistenten Inputs einen bestimmten Gedächtnisinhalt finden: Die meisten wissen sofort, auf wen die Beschreibung “... ist ein Schauspieler, ist intelligent und ist ein Politiker” zutrifft.
Google Scholar
Wenn hier von Bedeutung die Rede ist, so ist ein assoziationstheoretischer Bedeutungsbegriff zugrundegelegt und nicht - wie in der traditionellen Logik üblich - ein wahrheitstheoretischer. Hätte der Ausdruck “Idee” nicht so viele unerwünschte Nebenbedeutungen, könnte man sagen, daß Aktivierungsvektoren Ideen repräsentieren (sollen), während Symbole Begriffe repräsentieren. Entsprechend ist die repräsentationale Form von Aktivierungsvektoren eher holistischer bzw. “piktorialer” Natur.
Google Scholar
cf. z.B. Goschke and Koppelberg 1988: “... bei distribuierten Repräsentationen ist es zweckmäßig, komplexe Symbole als Aktivierungsmuster über eine große Anzahl von Recheneinheiten zu betrachten, von denen jede evtl. einen Mikrofaktor repräsentiert.”
Google Scholar
Fodor bezieht sich mit dieser Aussage nicht auf konnektionistische Systeme.
Google Scholar
Durch dieses Zitat wird auch deutlich, warum kognitive Prozesse für sie symbolische Prozesse sein müssen.
Google Scholar
Können die einzelnen Recheneinheiten nur zwei diskrete Werte annehmen, läßt sich der Aktivierungsvektor als Folge von Nullen und Einsen darstellen. Etwas problematischer ist es, wenn als Aktivierungswerte alle reellen Zahlen in einem bestimmten Intervall zugelassen sind. Hier könnte davon ausgegangen werden, daß dieses Kontinuum durch eine genügend große Anzahl diskreter Werte hinreichend approximiert werden kann.
Google Scholar
Endliche Manipulation diskreter Zeichen ist das Kriterium, das Haugeland (1985) für formale Systeme angibt.
Google Scholar
Es hat keinen Zweck, hier auf den Unterschied von deklarativem und prozeduralem Wissen zu verweisen. Auch prozedurales Wissen muß in Form expliziter Regeln repräsentiert sein (cf. Cummins 1986 ).
Google Scholar
Aus diesem Grund erfolgt weder in (nicht-programmierbaren) Taschenrechnern, noch in mechanischen Registrierkassen, noch in einem Abacus eine symbolische Informationsverarbeitung. Daß bestimmte Teile oder Zustände etwas repräsentieren (Symbole im normalen, semantischen Sinn sind), bleibt davon unbenommen.
Google Scholar
Newell definiert ein Symbolsystem als universelle Maschine (S. 154). Damit etwas eine universelle Maschine sein kann, muß es das Verhalten jeder anderen Maschine simulieren können. Eine notwendige Bedingung dafür ist, daß es Regeln gibt, durch deren Befolgung die universelle Maschine die spezielle Maschine simuliert. Eine Konsequenz daraus ist, daß konnektionistische Systeme keine universellen Maschinen sind.
Google Scholar
Genau wie die Prozesse, die dem “Kopf” einer realisierten Turing-Maschine ermöglichen, die Zeichen auf dem Rechenband zu lesen, keine Operationen der (abstrakten) Turing-Maschine sind, sondern nur Fragen der Implementation betreffen.
Google Scholar

Download references

Author information

Authors and Affiliations

Seminar für Philosophie, Logik und Wissenschaftstheorie, Universität München, Ludwigstraße 31, W-8000, München 22, Deutschland
Gerhard Helm

Authors

Gerhard Helm
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Helm, G. (1991). Konnektionistische Informationsverarbeitung. In: Symbolische und konnektionistische Modelle der menschlichen Informationsverarbeitung. Informatik-Fachberichte, vol 288. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-10178-0_5

Download citation

DOI: https://doi.org/10.1007/978-3-662-10178-0_5
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-54575-0
Online ISBN: 978-3-662-10178-0
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics