Zum Inhalt springen

Belohnungsvorhersagesystem

    Das Belohnungsvorhersagesystem oder Belohnungsprädiktionssystem des menschlichen Gehirns ist ein Netzwerk von Neuronen im ventralen Striatum bzw. im Nucleus accumbens, einer Hirnregion, die mit Motivation, Lernen und Gedächtnis in Verbindung steht. Das System verarbeitet Informationen über die Umwelt, die aktuellen Handlungen einer Person und die möglichen Folgen dieser Handlungen. Diese Informationen werden dann verwendet, um die Wahrscheinlichkeit einer positiven oder negativen Belohnung für eine konkrete Handlung vorherzusagen. Dieses Belohnungsvorhersagesystem ist für eine Vielzahl menschlicher Verhaltensweisen wichtig, z. B. indem es Menschen hilft, aus Erfahrungen zu lernen und neue Informationen zu behalten, aber auch indem es ihnen hilft, motiviert zu bleiben und ihre Ziele zu erreichen. Vor allem aber hilft es, Entscheidungen zu treffen, die wahrscheinlich zu positiven Ergebnissen führen.

    Anders als die Hirnforschung lange vermutete, ist für das Hochgefühl, wenn Menschen das bekommen, wonach sie sich sehnen, nicht das Dopamin verantwortlich, sondern diese Rolle kommt den körpereigenen Opiaten zu, den Endorphinen, sowie anderen Botenstoffen wie dem Oxytocin. Dopamin ist vielmehr der Neurotransmitter der Belohnungserwartung, d. h., das Dopaminsystem generiert ein tiefes Verlangen und gibt man diesem nach, reagiert das mesocortikolimbische System, das immer dann aktiv wird, wenn man eine Belohnung erwartet.

    Im Allgemeinen ist ein Belohnungsvorhersagesystem ein neuronales Netzwerk, das dazu verwendet wird, die Wahrscheinlichkeit einer positiven oder negativen Belohnung für eine bestimmte Handlung vorherzusagen, und das in jüngster Zeit auch mit maschinellem Lernen, Robotik und künstlicher Intelligenz in Verbindung gebracht wird. Im Zusammenhang mit maschinellem Lernen wird die Belohnungsvorhersage verwendet, um die Leistung eines Lernalgorithmus zu verbessern, d. h. ein System wird mit einer großen Menge von Daten trainiert, die die Handlung, die Belohnung und den Kontext der Handlung enthalten. Das System lernt dann, die Wahrscheinlichkeit einer positiven oder negativen Belohnung für eine bestimmte Aktion vorherzusagen, und diese Vorhersage kann dann verwendet werden, um die Leistung des Lernalgorithmus zu verbessern. Im Kontext der Robotik wird das Belohnungsvorhersagesystem verwendet, um Robotern beizubringen, in einer unsicheren Umgebung zu navigieren, so dass diese Vorhersage dann verwendet werden kann, um dem Roboter beizubringen, die sicherste Aktion in einer bestimmten Situation zu wählen. Im Kontext der künstlichen Intelligenz wird das Belohnungsprädiktionssystem verwendet, um künstlichen Intelligenzsystemen beizubringen, in einer bestimmten Situation die beste Entscheidung zu treffen.

    Literatur

    Stangl, W. (2023, 23. Dezember). Striatum. Online Lexikon für Psychologie & Pädagogik.
    https:// lexikon.stangl.eu/6346/striatum.


    Impressum ::: Datenschutzerklärung ::: Nachricht ::: © Werner Stangl :::

    Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert