Condicionamiento clásico

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Montaje de Pavlov sobre la configuración del condicionamiento en perros — Montaje experimental de Pavlov

El condicionamiento clásico (también conocido como pavloviano o condicionamiento respondiente) es un procedimiento conductual en el que un estímulo biológicamente potente (p. ej., comida) se combina con un estímulo previamente neutral (p. ej., una campana). También se refiere al proceso de aprendizaje que resulta de este emparejamiento, a través del cual el estímulo neutral llega a provocar una respuesta (por ejemplo, salivación) que suele ser similar a la provocada por el estímulo potente.

El condicionamiento clásico es distinto del condicionamiento operante (también llamado condicionamiento instrumental), a través del cual la fuerza de un comportamiento voluntario se modifica mediante refuerzo o castigo. Sin embargo, el condicionamiento clásico puede afectar el condicionamiento operante de varias formas; en particular, los estímulos condicionados clásicamente pueden servir para reforzar las respuestas operantes.

El condicionamiento clásico fue estudiado en detalle por primera vez por Ivan Pavlov, quien realizó experimentos con perros y publicó sus hallazgos en 1897. Durante el estudio de la digestión del fisiólogo ruso, Pavlov observó que los perros que servían como sus sujetos babeaban cuando se les servía carne.

El condicionamiento clásico es un mecanismo conductual básico, y sus sustratos neuronales ahora comienzan a comprenderse. Aunque a veces es difícil distinguir el condicionamiento clásico de otras formas de aprendizaje asociativo (por ejemplo, el aprendizaje instrumental y la memoria asociativa humana), varias observaciones los diferencian, especialmente las contingencias en las que se produce el aprendizaje.

Junto con el condicionamiento operante, el condicionamiento clásico se convirtió en la base del conductismo, una escuela de psicología que dominó a mediados del siglo XX y sigue siendo una influencia importante en la práctica de la terapia psicológica y el estudio del comportamiento animal. El condicionamiento clásico también se ha aplicado en otras áreas. Por ejemplo, puede afectar la respuesta del cuerpo a las drogas psicoactivas, la regulación del hambre, la investigación sobre las bases neuronales del aprendizaje y la memoria, y en ciertos fenómenos sociales como el efecto del falso consenso.

Definición

El condicionamiento clásico ocurre cuando un estímulo condicionado (CS) se combina con un estímulo incondicionado (US). Por lo general, el estímulo condicionado es un estímulo neutral (p. ej., el sonido de un diapasón), el estímulo incondicionado es biológicamente potente (p. ej., el sabor de la comida) y la respuesta incondicionada (UR) al estímulo incondicionado es una respuesta refleja no aprendida. (por ejemplo, salivación). Después de repetir el emparejamiento, el organismo exhibe una respuesta condicionada (RC) al estímulo condicionado cuando el estímulo condicionado se presenta solo. (Una respuesta condicionada puede ocurrir después de un solo emparejamiento). Por lo tanto, a diferencia de la UR, la CR se adquiere a través de la experiencia y también es menos permanente que la UR.

Por lo general, la respuesta condicionada es similar a la respuesta incondicionada, pero a veces es bastante diferente. Por esta y otras razones, la mayoría de los teóricos del aprendizaje sugieren que el estímulo condicionado viene a señalar o predecir el estímulo incondicionado, y pasan a analizar las consecuencias de esta señal. Robert A. Rescorla proporcionó un resumen claro de este cambio en el pensamiento y sus implicaciones en su artículo de 1988 "Condicionamiento pavloviano: no es lo que crees que es". A pesar de su amplia aceptación, la tesis de Rescorla puede no ser defendible.

El condicionamiento clásico difiere del condicionamiento operante o instrumental : en el condicionamiento clásico, los comportamientos se modifican a través de la asociación de estímulos como se describió anteriormente, mientras que en el condicionamiento operante los comportamientos se modifican por el efecto que producen (es decir, recompensa o castigo).

Investigación de Pavlov

El trabajo temprano más conocido y completo sobre el condicionamiento clásico fue realizado por Ivan Pavlov, aunque Edwin Twitmyer publicó algunos hallazgos relacionados un año antes.Durante su investigación sobre la fisiología de la digestión en perros, Pavlov desarrolló un procedimiento que le permitió estudiar los procesos digestivos de los animales durante largos períodos de tiempo. Redirigió los fluidos digestivos del animal fuera del cuerpo, donde podían medirse. Pavlov notó que sus perros comenzaban a salivar en presencia del técnico que normalmente los alimentaba, en lugar de simplemente salivar en presencia de comida. Pavlov llamó a la salivación anticipatoria de los perros "secreción psíquica". Poniendo estas observaciones informales a prueba experimental, Pavlov presentó un estímulo (por ejemplo, el sonido de un metrónomo) y luego le dio comida al perro; después de algunas repeticiones, los perros comenzaron a salivar en respuesta al estímulo. Pavlov concluyó que si un estímulo particular en el perro'

Terminología

El estímulo incondicionado (EI): hace referencia a aquel que de forma automática provoca una respuesta del organismo.
La respuesta incondicionada (RI): es aquella que ocurre en el cuerpo, de manera automática, ante un estímulo incondicionado.
El estímulo neutro (EN): en principio no provoca ningún tipo de respuesta en el organismo. Cuando se asocia de forma temporal con un estímulo incondicionado pasa a ser un estímulo condicionado, ya que adquiere el poder de provocar una respuesta al igual que el incondicionado.
La respuesta condicionada (RC): aquella que aparece al presentarse solo el estímulo condicionado. Normalmente, la RC es más débil que la RI y tarda más en aparecer una vez que el estímulo está presente.

En los experimentos de Pavlov el estímulo incondicionado (EI) era la comida porque sus efectos no dependían de la experiencia previa. El sonido del metrónomo es originalmente un estímulo neutral (NS) porque no provoca salivación en los perros. Luego del condicionamiento, el sonido del metrónomo se convierte en el estímulo condicionado (CS) o estímulo condicional; porque sus efectos dependen de su asociación con los alimentos. Del mismo modo, las respuestas del perro siguen el mismo arreglo condicionado versus incondicionado. La respuesta condicionada (RC) es la respuesta al estímulo condicionado, mientras que la respuesta incondicionada (UR) corresponde al estímulo incondicionado.

Pavlov informó muchos hechos básicos sobre el condicionamiento; por ejemplo, descubrió que el aprendizaje ocurría con mayor rapidez cuando el intervalo entre el CS y la aparición del US era relativamente corto.

Como se señaló anteriormente, a menudo se piensa que la respuesta condicionada es una réplica de la respuesta incondicionada, pero Pavlov señaló que la saliva producida por el CS difiere en composición de la producida por los EE. UU. De hecho, el CR puede ser cualquier respuesta nueva al CS previamente neutral que puede vincularse claramente a la experiencia con la relación condicional de CS y US. También se pensó que los emparejamientos repetidos son necesarios para que surja el condicionamiento, pero muchas CR se pueden aprender con una sola prueba, especialmente en el aprendizaje del condicionamiento del miedo y la aversión al gusto.

Formas de condicionamiento clásico

Condicionamiento hacia adelante o progresivo

El aprendizaje es más rápido en el condicionamiento directo. Durante el condicionamiento directo, el inicio de CS precede al inicio de EE. UU. para señalar que EE. UU. lo seguirá. Dos formas comunes de condicionamiento directo son el retraso y el condicionamiento de seguimiento.

Condicionamiento de retraso : en el condicionamiento de retraso, el CS se presenta y se superpone con la presentación de los EE. UU. Por ejemplo, si una persona escucha un zumbador durante cinco segundos, tiempo durante el cual se le inyecta aire en el ojo, la persona parpadeará. Después de varios emparejamientos del zumbador y la bocanada, la persona parpadeará solo con el sonido del zumbador. Esto es condicionamiento de retraso.
Acondicionamiento de trazas : durante el acondicionamiento de trazas, el CS y el US no se superponen. En cambio, el CS comienza y termina antes de que se presenten los EE. UU. El período libre de estímulo se denomina intervalo de seguimiento o intervalo de condicionamiento. Si en el ejemplo anterior del zumbador, la bocanada se produjo un segundo después de que se detuviera el sonido del zumbador, eso sería un acondicionamiento de seguimiento, con un intervalo de seguimiento o acondicionamiento de un segundo.

Condicionamiento simultáneo

Durante el condicionamiento simultáneo, el CS y el US se presentan y terminan al mismo tiempo. Por ejemplo: si una persona escucha una campana y se le inyecta aire en el ojo al mismo tiempo, y los emparejamientos repetidos como este hacen que la persona parpadee cuando escucha la campana a pesar de que la bocanada de aire está ausente, esto demuestra que el condicionamiento simultáneo tiene ocurrió.

Condicionamiento de segundo orden y de orden superior

El condicionamiento de segundo orden o de orden superior sigue un procedimiento de dos pasos. Primero, un estímulo neutral ("CS1") viene a señalar un EE. UU. a través del condicionamiento hacia adelante. Luego, un segundo estímulo neutral ("CS2") se empareja con el primero (CS1) y llega a producir su propia respuesta condicionada. Por ejemplo: una campana puede combinarse con comida hasta que la campana provoque la salivación. Si luego se combina una luz con la campana, entonces la luz también puede provocar la salivación. El timbre es el CS1 y la comida es la estadounidense. La luz se convierte en el CS2 una vez que se empareja con el CS1.

Condicionamiento hacia atrás o regresivo

El condicionamiento hacia atrás ocurre cuando un CS sigue inmediatamente a un US. A diferencia del procedimiento de condicionamiento habitual, en el que el CS precede al US, la respuesta condicionada que se da al CS tiende a ser inhibitoria. Presumiblemente, esto sucede porque la CS sirve como una señal de que EE. UU. ha terminado, en lugar de una señal de que EE. UU. está a punto de aparecer. Por ejemplo, una bocanada de aire dirigida al ojo de una persona podría ser seguida por el sonido de un zumbador.

Condicionamiento temporal

En el condicionamiento temporal, se presenta un US a intervalos regulares, por ejemplo, cada 10 minutos. Se dice que el condicionamiento ha ocurrido cuando el CR tiende a ocurrir poco antes de cada US. Esto sugiere que los animales tienen un reloj biológico que puede servir como CS. Este método también se ha utilizado para estudiar la capacidad de sincronización en animales (ver Cognición animal).

El siguiente ejemplo muestra el condicionamiento temporal, ya que EE. UU., como la comida para un ratón hambriento, simplemente se entrega en un horario regular, como cada treinta segundos. Después de una exposición suficiente, el ratón comenzará a salivar justo antes de la entrega de alimentos. Esto entonces lo convierte en un condicionamiento temporal, ya que parecería que el ratón está condicionado al paso del tiempo.

Procedimiento de contingencia cero

En este procedimiento, el CS está emparejado con el EE. UU., pero el EE. UU. también ocurre en otros momentos. Si esto ocurre, se predice que es probable que ocurra en EE. UU. en ausencia de la CS. En otras palabras, la CS no "predice" a EE.UU. En este caso, el condicionamiento falla y el CS no llega a provocar un CR. Este hallazgo, que la predicción en lugar del emparejamiento CS-US es la clave del condicionamiento, influyó en gran medida en la investigación y la teoría del condicionamiento posterior.

Condicionamiento de Extinción

En el procedimiento de extinción, el CS se presenta repetidamente en ausencia de un US. Esto se hace después de que un CS haya sido acondicionado por uno de los métodos anteriores. Cuando se hace esto, la frecuencia CR eventualmente vuelve a los niveles previos al entrenamiento. Sin embargo, la extinción no elimina los efectos del condicionamiento previo. Esto se demuestra mediante la recuperación espontánea, cuando hay una aparición repentina del (CR) después de que ocurre la extinción, y otros fenómenos relacionados (ver "Recuperación de la extinción" a continuación). Estos fenómenos pueden explicarse postulando acumulación de inhibición cuando se presenta un estímulo débil.

Estímulos condicionados

Adquisición

Durante la adquisición, el CS y el US se emparejan como se describe anteriormente. El alcance del acondicionamiento puede ser rastreado por ensayos de prueba. En estos ensayos de prueba, el CS se presenta solo y se mide el CR. Un solo emparejamiento CS-US puede ser suficiente para producir una RC en una prueba, pero generalmente se necesitan varios emparejamientos y hay un aumento gradual en la respuesta condicionada al CS. Este número repetido de intentos aumenta gradualmente la fuerza y/o la frecuencia de la CR. La velocidad del acondicionamiento depende de una serie de factores, como la naturaleza y la fuerza tanto del CS como del US, la experiencia previa y el estado de motivación del animal. El proceso se ralentiza a medida que se acerca a su finalización.

Extinción

Si la CS se presenta sin US, y este proceso se repite con suficiente frecuencia, la CS finalmente dejará de provocar una RC. En este punto se dice que el CR está "extinguido".

Inhibición externa

Se puede observar una inhibición externa si se presenta un estímulo fuerte o desconocido justo antes o al mismo tiempo que el EC. Esto provoca una reducción en la respuesta condicionada al CS.

Recuperación de la extinción

Varios procedimientos conducen a la recuperación de un CR que había sido acondicionado primero y luego extinguido. Esto ilustra que el procedimiento de extinción no elimina el efecto del condicionamiento. Estos procedimientos son los siguientes:

Readquisición: si el CS vuelve a emparejarse con los EE. UU., se adquiere nuevamente un CR, pero esta segunda adquisición suele ocurrir mucho más rápido que la primera.
Recuperación espontánea: La recuperación espontánea se define como la reaparición de una respuesta condicionada previamente extinguida después de un período de descanso. Es decir, si el CS se prueba en un momento posterior (por ejemplo, una hora o un día) después de la extinción, nuevamente generará un CR. Este CR renovado suele ser mucho más débil que el CR observado antes de la extinción.
Desinhibición: si la CS se prueba justo después de la extinción y se ha producido un estímulo intenso pero asociativamente neutral, puede haber una recuperación temporal de la respuesta condicionada a la CS.
Restablecimiento: si el US utilizado en el condicionamiento se presenta a un sujeto en el mismo lugar donde ocurrió el condicionamiento y la extinción, pero sin que esté presente el CS, el CS a menudo provoca una respuesta cuando se prueba más tarde.
Renovación: La renovación es el resurgimiento de una respuesta condicionada después de la extinción cuando un animal regresa al entorno en el que se adquirió la respuesta condicionada.

Generalización de estímulos

Se dice que la generalización del estímulo ocurre si, después de que un CS en particular ha llegado a provocar un CR, se encuentra que un estímulo de prueba similar provoca el mismo CR. Por lo general, cuanto más similar sea el estímulo de prueba al CS, más fuerte será el CR al estímulo de prueba. Por el contrario, cuanto más difiera el estímulo de prueba del CS, más débil será el CR, o más diferirá del observado previamente.

Discriminación de estímulos

Se observa discriminación de estímulos cuando un estímulo ("CS1") provoca una CR y otro estímulo ("CS2") provoca otra CR o ninguna CR. Esto puede lograrse, por ejemplo, emparejando CS1 con un US efectivo y presentando CS2 sin US.

Inhibición latente

La inhibición latente se refiere a la observación de que un estímulo familiar tarda más en convertirse en una CS que un estímulo nuevo en convertirse en una EC, cuando el estímulo se combina con una EE efectiva.

Supresión condicionada

Esta es una de las formas más comunes de medir la fuerza del aprendizaje en el condicionamiento clásico. Un ejemplo típico de este procedimiento es el siguiente: una rata primero aprende a presionar una palanca a través del condicionamiento operante. Luego, en una serie de pruebas, se expone a la rata a un CS, una luz o un ruido, seguido de un EE. UU., una descarga eléctrica leve. Se desarrolla una asociación entre el CS y el US, y la rata reduce la velocidad o deja de presionar la palanca cuando se enciende el CS. La tasa de presión durante el CS mide la fuerza del condicionamiento clásico; es decir, cuanto más lento presiona la rata, más fuerte es la asociación de CS y EE. UU. (Presionar lentamente indica una respuesta condicionada de "miedo", y es un ejemplo de una respuesta emocional condicionada; consulte la sección a continuación).

Inhibición condicionada

Típicamente, se utilizan tres fases de acondicionamiento.

Fase 1

Un CS (CS+) se combina con un US hasta que se alcanzan los niveles asintóticos de RC.

Fase 2

Los ensayos de CS+/US continúan, pero se intercalan con ensayos en los que el CS+ se combina con un segundo CS (el CS-) pero no con el US (es decir, ensayos CS+/CS-). Por lo general, los organismos muestran CR en los ensayos CS+/US, pero dejan de responder en los ensayos CS+/CS−.

Fase 3

Prueba de suma para la inhibición condicionada: el CS- de la fase 2 se presenta junto con un nuevo CS+ que se condicionó como en la fase 1. La inhibición condicionada se encuentra si la respuesta es menor al par CS+/CS- que al CS+ solo.
Prueba de retardo para inhibición condicionada: El CS- de la fase 2 se empareja con el US. Si se ha producido una inhibición condicionada, la tasa de adquisición de la CS- anterior debe ser menor que la tasa de adquisición que se encontraría sin el tratamiento de fase 2.

Bloqueo

Esta forma de condicionamiento clásico implica dos fases.

Fase 1

Un CS (CS1) está emparejado con un US.

Fase 2

Un compuesto CS (CS1+CS2) se empareja con un US.

Prueba

Se realiza una prueba separada para cada CS (CS1 y CS2). El efecto de bloqueo se observa en la falta de respuesta condicional a CS2, lo que sugiere que la primera fase de entrenamiento bloqueó la adquisición de la segunda CS.

Teorías sobre el condicionamiento clásico

Los experimentos sobre cuestiones teóricas del condicionamiento se han realizado principalmente en vertebrados, especialmente ratas y palomas. Sin embargo, el condicionamiento también se ha estudiado en invertebrados, y datos muy importantes sobre la base neural del condicionamiento provienen de experimentos con la babosa de mar, Aplysia. La mayoría de los experimentos relevantes han utilizado el procedimiento de condicionamiento clásico, aunque también se han utilizado experimentos de condicionamiento instrumental (operante), y la fuerza del condicionamiento clásico a menudo se mide a través de sus efectos operantes, como en la supresión condicionada (consulte la sección Fenómenos anterior) y la autoformación.

Teoría de la sustitución del estímulo o Pavloviana

Según Pavlov, el condicionamiento no implica la adquisición de ningún comportamiento nuevo, sino la tendencia a responder de la misma manera a los nuevos estímulos. Por lo tanto, teorizó que el CS simplemente sustituye al US al evocar la respuesta refleja. Esta explicación se denomina teoría del condicionamiento de sustitución de estímulos. Un problema crítico de la teoría de sustitución de estímulos es que CR y UR no siempre son iguales. El mismo Pavlov observó que la saliva de un perro producida como CR difería en composición de la producida como UR. El CR a veces es incluso lo opuesto al UR. Por ejemplo: la respuesta incondicional a una descarga eléctrica es un aumento de la frecuencia cardíaca, mientras que una CS que se ha emparejado con la descarga eléctrica provoca una disminución de la frecuencia cardíaca. (Sin embargo, se ha propuestoque solo cuando el UR no involucra al sistema nervioso central son opuestos el CR y el UR).

Modelo Rescorla-Wagner

El modelo Rescorla-Wagner (R-W) es un modelo de condicionamiento relativamente simple pero poderoso. El modelo predice una serie de fenómenos importantes, pero también falla en aspectos importantes, lo que lleva a una serie de modificaciones y modelos alternativos. Sin embargo, debido a que gran parte de la investigación teórica sobre el condicionamiento en los últimos 40 años ha sido instigada por este modelo o reacciones a él, el modelo R-W merece una breve descripción aquí.

El modelo Rescorla-Wagner argumenta que existe un límite en la cantidad de condicionamiento que puede ocurrir en el emparejamiento de dos estímulos. Un determinante de este límite es la naturaleza de los Estados Unidos. Por ejemplo: emparejar una campana con un bistec jugoso tiene más probabilidades de producir salivación que emparejar la campana con un trozo de pan seco, y es probable que el pan seco funcione mejor que un trozo de cartón. Una idea clave detrás del modelo R-W es que un CS señala o predice los EE. UU. Se podría decir que antes de condicionar, el sujeto es sorprendido por los EE.UU. Sin embargo, después del condicionamiento, el sujeto ya no se sorprende, porque el CS predice la llegada de los EE.UU. (Tenga en cuenta que el modelo se puede describir matemáticamente y que palabras como predecir, sorprender y esperar solo se usan para ayudar a explicar el modelo. ) Aquí se ilustra el funcionamiento del modelo con breves explicaciones de adquisición, extinción y bloqueo. El modelo también predice una serie de otros fenómenos; consulte el artículo principal sobre el modelo.

Ecuación

${\ estilo de visualización \ Delta V = \ alfa \ beta (\ lambda - \ Sigma V)}$

Esta es la ecuación de Rescorla-Wagner. Especifica la cantidad de aprendizaje que ocurrirá en un solo emparejamiento de un estímulo condicionante (CS) con un estímulo incondicionado (US). La ecuación anterior se resuelve repetidamente para predecir el curso del aprendizaje en muchos de estos ensayos.

En este modelo, el grado de aprendizaje se mide por qué tan bien el CS predice el EE. UU., que viene dado por la "fuerza asociativa" del CS. En la ecuación, V representa la fuerza asociativa actual del CS y ∆V es el cambio en esta fuerza que ocurre en una prueba dada. ΣV es la suma de las fuerzas de todos los estímulos presentes en la situación. λ es la fuerza asociativa máxima que soportará un EE.UU. dado; su valor suele establecerse en 1 en las pruebas cuando EE. UU. está presente y en 0 cuando EE. UU. está ausente. α y β son constantes relacionadas con la prominencia del CS y la velocidad de aprendizaje para un US dado. Cómo la ecuación predice varios resultados experimentales se explica en las siguientes secciones. Para más detalles, consulte el artículo principal sobre el modelo.

Modelo R–W: adquisición

El modelo R-W mide el condicionamiento asignando una "fuerza asociativa" al CS y otros estímulos locales. Antes de condicionar un CS, tiene una fuerza asociativa de cero. Emparejar el CS y el US provoca un aumento gradual en la fuerza asociativa del CS. Este aumento está determinado por la naturaleza de los EE.UU. (por ejemplo, su intensidad).La cantidad de aprendizaje que ocurre durante cualquier emparejamiento individual CS-US depende de la diferencia entre las fuerzas asociativas totales de CS y otros estímulos presentes en la situación (ΣV en la ecuación), y un máximo establecido por US (λ en la ecuación ). En el primer emparejamiento de CS y US, esta diferencia es grande y la fuerza asociativa de CS da un gran paso hacia arriba. A medida que se acumulan los emparejamientos CS-US, US se vuelve más predecible y el aumento de la fuerza asociativa en cada prueba se vuelve cada vez más pequeño. Finalmente, la diferencia entre la fuerza asociativa del CS (más cualquiera que pueda acumularse a otros estímulos) y la fuerza máxima llega a cero. Es decir, el EE. UU. está completamente predicho, la fuerza asociativa del CS deja de crecer y el condicionamiento está completo.

Modelo R–W: extinción

El proceso asociativo descrito por el modelo R-W también explica la extinción (ver "procedimientos" arriba). El procedimiento de extinción comienza con una fuerza asociativa positiva del CS, lo que significa que el CS predice que ocurrirá el EE. UU. En un juicio de extinción, los EE. UU. no se producen después de la CS. Como resultado de este resultado "sorprendente", la fuerza asociativa del CS da un paso hacia abajo. La extinción es completa cuando la fuerza del CS llega a cero; no se predice ningún EE. UU. y no ocurre ningún EE. UU. Sin embargo, si ese mismo CS se presenta sin EE. UU. pero acompañado de un inhibidor condicionado (IC) bien establecido, es decir, un estímulo que predice la ausencia de EE. UU. (en términos de RW, un estímulo con una fuerza asociada negativa) entonces RW predice que el CS no se extinguirá (su V no disminuirá de tamaño).

Modelo R–W: bloqueo

La contribución más importante y novedosa del modelo R-W es su suposición de que el condicionamiento de un CS depende no solo de ese CS solo y su relación con el EE. UU., sino también de todos los demás estímulos presentes en la situación de condicionamiento. En particular, el modelo establece que el EE. UU. se predice mediante la suma de las fuerzas asociativas de todos los estímulos presentes en la situación de condicionamiento. El aprendizaje está controlado por la diferencia entre esta fuerza asociativa total y la fuerza apoyada por EE.UU. Cuando esta suma de fuerzas alcanza un máximo establecido por los EE. UU., el condicionamiento termina como se acaba de describir.

La explicación R-W del fenómeno de bloqueo ilustra una consecuencia de la suposición que acabamos de exponer. En el bloqueo (ver "fenómenos" arriba), CS1 se empareja con US hasta que se completa el condicionamiento. Luego, en ensayos de condicionamiento adicionales, aparece un segundo estímulo (CS2) junto con CS1, y ambos son seguidos por el EE. UU. Finalmente, se prueba CS2 y se muestra que no produce ninguna respuesta porque el aprendizaje inicial sobre CS1 "bloqueó" el aprendizaje sobre CS2. El modelo R–W explica esto diciendo que después del condicionamiento inicial, CS1 predice completamente los EE. UU. Dado que no hay diferencia entre lo que se predice y lo que sucede, no ocurre ningún aprendizaje nuevo en los ensayos adicionales con CS1+CS2, por lo tanto, CS2 luego no produce respuesta.

Problemas teóricos y alternativas al modelo Rescorla-Wagner

Una de las principales razones de la importancia del modelo R-W es que es relativamente simple y hace predicciones claras. Las pruebas de estas predicciones han dado lugar a una serie de nuevos hallazgos importantes y a una comprensión considerablemente mayor del condicionamiento. Cierta información nueva ha apoyado la teoría, pero mucha no, y en general se acepta que la teoría es, en el mejor de los casos, demasiado simple. Sin embargo, ningún modelo único parece dar cuenta de todos los fenómenos que han producido los experimentos. A continuación se presentan breves resúmenes de algunas cuestiones teóricas relacionadas.

Contenido de aprendizaje

El modelo R-W reduce el condicionamiento a la asociación de un CS y US, y mide esto con un solo número, la fuerza asociativa del CS. Una serie de hallazgos experimentales indican que se aprende más que esto. Entre estos hay dos fenómenos descritos anteriormente en este artículo.

Inhibición latente: si un sujeto se expone repetidamente al CS antes de que comience el acondicionamiento, el acondicionamiento lleva más tiempo. El modelo R-W no puede explicar esto porque la exposición previa deja la fuerza del CS sin cambios en cero.
Recuperación de la respuesta después de la extinción: parece que algo permanece después de que la extinción ha reducido la fuerza asociativa a cero porque varios procedimientos hacen que la respuesta reaparezca sin más condicionamiento.

Papel de la atención en el aprendizaje.

La inhibición latente puede ocurrir porque un sujeto deja de enfocarse en un CS que se ve con frecuencia antes de emparejarlo con un US. De hecho, los cambios en la atención al CS están en el corazón de dos teorías prominentes que intentan hacer frente a los resultados experimentales que dificultan el modelo R-W. En uno de ellos, propuesto por Nicholas Mackintosh, la velocidad del condicionamiento depende de la cantidad de atención dedicada a la CS, y esta cantidad de atención depende a su vez de qué tan bien la CS predice el EE. UU. Pearce y Hall propusieron un modelo relacionado basado en un principio atencional diferenteAmbos modelos han sido ampliamente probados y ninguno explica todos los resultados experimentales. En consecuencia, varios autores han intentado modelos híbridos que combinan los dos procesos atencionales. Pearce y Hall en 2010 integraron sus ideas atencionales e incluso sugirieron la posibilidad de incorporar la ecuación Rescorla-Wagner en un modelo integrado.

Contexto

Como se indicó anteriormente, una idea clave en el condicionamiento es que el CS señala o predice los EE. UU. (ver "procedimiento de contingencia cero" más arriba). Sin embargo, por ejemplo, la habitación en la que tiene lugar el condicionamiento también "predice" que puede ocurrir el EE.UU. Aun así, la sala predice con mucha menos certeza que el CS experimental en sí mismo, porque la sala también está ahí entre los ensayos experimentales, cuando los EE. UU. están ausentes. El papel de tal contexto se ilustra por el hecho de que los perros en el experimento de Pavlov a veces comenzaban a salivar cuando se acercaban al aparato experimental, antes de ver o escuchar cualquier EC.Los llamados estímulos de "contexto" siempre están presentes, y su influencia ayuda a explicar algunos hallazgos experimentales que de otro modo serían desconcertantes. La fuerza asociativa de los estímulos contextuales se puede ingresar en la ecuación de Rescorla-Wagner, y juegan un papel importante en las teorías de comparación y computacionales que se describen a continuación.

Teoría del comparador

Para averiguar lo que se ha aprendido, debemos medir de alguna manera el comportamiento ("desempeño") en una situación de prueba. Sin embargo, como los estudiantes saben muy bien, el desempeño en una situación de prueba no siempre es una buena medida de lo que se ha aprendido. En cuanto al condicionamiento, existe evidencia de que los sujetos en un experimento de bloqueo aprenden algo sobre el CS "bloqueado", pero no muestran este aprendizaje debido a la forma en que generalmente se prueban.

Las teorías "comparadoras" del condicionamiento están "basadas en el desempeño", es decir, enfatizan lo que está sucediendo en el momento de la prueba. En particular, analizan todos los estímulos que están presentes durante la prueba y cómo pueden interactuar las asociaciones adquiridas por estos estímulos.Para simplificar un poco, las teorías comparativas asumen que durante el condicionamiento el sujeto adquiere asociaciones CS-US y contexto-US. En el momento de la prueba, estas asociaciones se comparan y se produce una respuesta a la CS solo si la asociación CS-US es más fuerte que la asociación contexto-US. Después de que una CS y US se emparejan repetidamente en una adquisición simple, la asociación CS-US es fuerte y la asociación contexto-US es relativamente débil. Esto significa que el CS provoca un CR fuerte. En "contingencia cero" (ver arriba), la respuesta condicionada es débil o está ausente porque la asociación contexto-EE.UU. es tan fuerte como la asociación CS-EE.UU. El bloqueo y otros fenómenos más sutiles también pueden explicarse mediante teorías comparativas, aunque, de nuevo, no pueden explicarlo todo.

Teoría computacional

La necesidad de un organismo de predecir eventos futuros es fundamental para las teorías modernas del condicionamiento. La mayoría de las teorías utilizan asociaciones entre estímulos para hacerse cargo de estas predicciones. Por ejemplo: en el modelo R–W, la fuerza asociativa de un CS nos dice con qué fuerza ese CS predice un US. Modelos como el propuesto por Gallistel y Gibbon (2000, 2002) sugieren un enfoque diferente de la predicción. Aquí la respuesta no está determinada por las fuerzas asociativas. En su lugar, el organismo registra los tiempos de inicio y finalización de los CS y los US y los utiliza para calcular la probabilidad de que los EE. UU. sigan al CS. Varios experimentos han demostrado que los humanos y los animales pueden aprender a cronometrar eventos (ver Cognición animal), y el modelo de Gallistel & Gibbon produce muy buenos ajustes cuantitativos para una variedad de datos experimentales.Sin embargo, estudios recientes han sugerido que los modelos basados en la duración no pueden dar cuenta de algunos hallazgos empíricos tan bien como los modelos asociativos.

Modelos basados en elementos

El modelo Rescorla-Wagner trata un estímulo como una sola entidad y representa la fuerza asociativa de un estímulo con un número, sin registro de cómo se alcanzó ese número. Como se señaló anteriormente, esto dificulta que el modelo tenga en cuenta una serie de resultados experimentales. Se proporciona más flexibilidad al suponer que un estímulo está representado internamente por una colección de elementos, cada uno de los cuales puede cambiar de un estado asociativo a otro. Por ejemplo, la similitud de un estímulo con otro puede representarse diciendo que los dos estímulos comparten elementos en común. Estos elementos compartidos ayudan a explicar la generalización del estímulo y otros fenómenos que pueden depender de la generalización. Además, diferentes elementos dentro del mismo conjunto pueden tener diferentes asociaciones, y sus activaciones y asociaciones pueden cambiar en diferentes momentos ya diferentes ritmos. Esto permite que los modelos basados en elementos manejen algunos resultados que de otro modo serían inexplicables.

El modelo POE

Un ejemplo destacado del enfoque de elementos es el modelo "SOP" de Wagner. El modelo ha sido elaborado de varias maneras desde su introducción y ahora puede dar cuenta en principio de una amplia variedad de hallazgos experimentales. El modelo representa cualquier estímulo dado con una gran colección de elementos. El tiempo de presentación de varios estímulos, el estado de sus elementos y las interacciones entre los elementos determinan el curso de los procesos asociativos y los comportamientos observados durante los experimentos de condicionamiento.

La cuenta SOP del condicionamiento simple ejemplifica algunos elementos esenciales del modelo SOP. Para empezar, el modelo asume que CS y US están representados cada uno por un gran grupo de elementos. Cada uno de estos elementos de estímulo puede estar en uno de tres estados:

Actividad primaria (A1): en términos generales, se "atiende" al estímulo. (Las referencias a "atención" están destinadas únicamente a facilitar la comprensión y no forman parte del modelo).
actividad secundaria (A2) - El estímulo es "atendida periféricamente".
inactivo (I): el estímulo "no se atiende".

De los elementos que representan un solo estímulo en un momento dado, algunos pueden estar en el estado A1, algunos en el estado A2 y algunos en el estado I.

Cuando aparece un estímulo por primera vez, algunos de sus elementos saltan de la inactividad I a la actividad primaria A1. Desde el estado A1 decaen gradualmente a A2 y finalmente regresan a I. La actividad de los elementos solo puede cambiar de esta manera; en particular, los elementos en A2 no pueden volver directamente a A1. Si los elementos tanto del CS como del US están en el estado A1 al mismo tiempo, se aprende una asociación entre los dos estímulos. Esto significa que si, en un momento posterior, el CS se presenta antes que los EE. UU. y algunos elementos del CS entran en A1, estos elementos activarán algunos elementos de los EE. UU. Sin embargo, los elementos estadounidenses activados indirectamente de esta manera solo se impulsan al estado A2. (Se puede pensar que el CS despierta un recuerdo de los EE. UU., que no será tan fuerte como el real). Con los ensayos repetidos de CS-US, se asocian más y más elementos, y más y más elementos estadounidenses van a A2 cuando se enciende el CS. Esto deja gradualmente menos y menos elementos de EE. UU. que pueden ingresar a A1 cuando aparece EE. UU. mismo. En consecuencia, el aprendizaje se ralentiza y se acerca a un límite. Se podría decir que EE. UU. está "totalmente predicho" o "no sorprende" porque casi todos sus elementos solo pueden ingresar a A2 cuando se enciende el CS, dejando pocos para formar nuevas asociaciones.

El modelo puede explicar los hallazgos que se explican en el modelo Rescorla-Wagner y también una serie de hallazgos adicionales. Por ejemplo, a diferencia de la mayoría de los otros modelos, SOP tiene en cuenta el tiempo. El aumento y la disminución de la activación del elemento permite que el modelo explique los efectos dependientes del tiempo, como el hecho de que el condicionamiento es más fuerte cuando el CS viene justo antes que el US, y cuando el CS viene después del US ("condicionamiento hacia atrás"), el resultado es a menudo un CS inhibitorio. También se explican muchos otros fenómenos más sutiles.

En los últimos años han aparecido otros modelos potentes que incorporan representaciones de elementos. Estos a menudo incluyen la suposición de que las asociaciones involucran una red de conexiones entre "nodos" que representan estímulos, respuestas y quizás una o más capas "ocultas" de interconexiones intermedias. Dichos modelos entran en contacto con una explosión actual de investigación sobre redes neuronales, inteligencia artificial y aprendizaje automático.

Usos del condicionamiento clásico

(inglés) CS: estímulo condicionado, US: estímulo incondicionado, Delay: retardo, conditioning: condicionamiento

Base neural del aprendizaje y la memoria

Pavlov propuso que el condicionamiento involucraba una conexión entre los centros cerebrales para estímulos condicionados e incondicionados. Se ha abandonado su explicación fisiológica del condicionamiento, pero el condicionamiento clásico sigue utilizándose para estudiar las estructuras y funciones neuronales que subyacen al aprendizaje y la memoria. Las formas de condicionamiento clásico que se utilizan para este propósito incluyen, entre otras, el condicionamiento del miedo, el condicionamiento del parpadeo y el condicionamiento de la contracción del pie de Hermissenda crassicornis, una babosa de mar. Tanto el miedo como el condicionamiento del parpadeo implican un estímulo neutral, con frecuencia un tono, que se combina con un estímulo incondicionado. En el caso del condicionamiento de parpadeo, el EE. UU. es una bocanada de aire, mientras que en el condicionamiento del miedo, el EE. UU. es amenazante o aversivo, como un golpe en el pie.

"Los datos disponibles demuestran que las regiones discretas del cerebelo y las áreas asociadas del tronco encefálico contienen neuronas que alteran su actividad durante el condicionamiento; estas regiones son fundamentales para la adquisición y el desempeño de esta simple tarea de aprendizaje. Parece que otras regiones del cerebro, incluido el hipocampo, la amígdala y la corteza prefrontal contribuyen al proceso de condicionamiento, especialmente cuando las demandas de la tarea se vuelven más complejas".

El condicionamiento del miedo y el parpadeo generalmente involucran circuitos neuronales que no se superponen, pero comparten mecanismos moleculares. El condicionamiento del miedo se produce en la amígdala basolateral, que recibe impulsos glutaminérgicos directamente de los aferentes talámicos, así como indirectamente de las proyecciones prefrontales. Las proyecciones directas son suficientes para el condicionamiento de retardo, pero en el caso del condicionamiento de trazas, donde el CS necesita estar representado internamente a pesar de la falta de estímulo externo, son necesarias vías indirectas. El cingulado anterior es un candidato para el condicionamiento intermedio de trazas, pero el hipocampo también puede desempeñar un papel importante. La activación presináptica de la proteína quinasa A y la activación postsináptica de los receptores NMDA y su vía de transducción de señales son necesarias para condicionar la plasticidad relacionada.Como los receptores NMDA solo se activan después de un aumento en el calcio presináptico (liberando así el bloqueo de Mg2+), son un detector de coincidencia potencial que podría mediar en la plasticidad dependiente del tiempo de pico. STDP restringe LTP a situaciones en las que CS predice los EE. UU. y LTD a la inversa.

Terapias conductuales

Algunas terapias asociadas al condicionamiento clásico son la terapia de aversión, la desensibilización sistemática y la inundación. La terapia de aversión es un tipo de terapia conductual diseñada para hacer que los pacientes abandonen un hábito indeseable al asociar el hábito con un fuerte estímulo incondicionado desagradable. Por ejemplo, se podría usar un medicamento para asociar el sabor del alcohol con el malestar estomacal. La desensibilización sistemática es un tratamiento para las fobias en el que se entrena al paciente para que se relaje mientras se expone progresivamente a estímulos que provocan más ansiedad (por ejemplo, palabras de enfado). Este es un ejemplo de contracondicionamiento, destinado a asociar los estímulos temidos con una respuesta (relajación) incompatible con la ansiedad.El flooding es una forma de desensibilización que intenta eliminar las fobias y ansiedades mediante la exposición repetida a estímulos altamente angustiosos hasta que la falta de refuerzo de la respuesta de ansiedad provoca su extinción. La "inundación" generalmente implica la exposición real a los estímulos, mientras que el término "implosión" se refiere a la exposición imaginaria, pero los dos términos a veces se usan como sinónimos.

Las terapias de condicionamiento generalmente toman menos tiempo que las terapias humanísticas.

Respuesta condicionada al fármaco

Un estímulo que está presente cuando se administra o consume una droga puede eventualmente provocar una respuesta fisiológica condicionada que imita el efecto de la droga. Este es a veces el caso de la cafeína; los bebedores habituales de café pueden encontrar que el olor del café les da una sensación de alerta. En otros casos, la respuesta condicionada es una reacción compensatoria que tiende a contrarrestar los efectos de la droga. Por ejemplo, si una droga hace que el cuerpo se vuelva menos sensible al dolor, la reacción condicionada compensatoria puede hacer que el usuario sea más sensible al dolor. Esta reacción compensatoria puede contribuir a la tolerancia al fármaco. Si es así, un usuario de drogas puede aumentar la cantidad de droga consumida para sentir sus efectos y terminar tomando cantidades muy grandes de la droga. En este caso, puede ocurrir una reacción de sobredosis peligrosa si el CS está ausente, de modo que no se produzca el efecto compensatorio condicionado. Por ejemplo, si la droga se ha administrado siempre en la misma habitación, los estímulos proporcionados por esa habitación pueden producir un efecto compensatorio condicionado; entonces puede ocurrir una reacción de sobredosis si el fármaco se administra en un lugar diferente donde los estímulos condicionados están ausentes.

Hambre condicionada

Las señales que preceden constantemente a la ingesta de alimentos pueden convertirse en estímulos condicionados para un conjunto de respuestas corporales que preparan el cuerpo para la comida y la digestión. Estas respuestas reflejas incluyen la secreción de jugos digestivos en el estómago y la secreción de ciertas hormonas en el torrente sanguíneo, y provocan un estado de hambre. Un ejemplo de hambre condicionada es el "efecto aperitivo". Cualquier señal que precede constantemente a una comida, como un reloj que indica que es hora de cenar, puede hacer que las personas sientan más hambre que antes de la señal. El hipotálamo lateral (LH) está involucrado en el inicio de la alimentación. Se ha demostrado que la vía nigroestriatal, que incluye la sustancia negra, el hipotálamo lateral y los ganglios basales, está involucrada en la motivación del hambre.

Respuesta emocional condicionada

La influencia del condicionamiento clásico se puede ver en respuestas emocionales como fobia, repugnancia, náuseas, ira y excitación sexual. Un ejemplo familiar son las náuseas condicionadas, en las que la SC es la vista o el olfato de un alimento en particular que en el pasado resultó en un malestar estomacal no condicionado. De manera similar, cuando el SC es la vista de un perro y el US es el dolor de ser mordido, el resultado puede ser un miedo condicionado a los perros. Un ejemplo de respuesta emocional condicionada es la supresión condicionada.

Como mecanismo de adaptación, el condicionamiento emocional ayuda a proteger a un individuo del daño o lo prepara para eventos biológicos importantes como la actividad sexual. Así, un estímulo que ha ocurrido antes de la interacción sexual llega a causar excitación sexual, lo que prepara al individuo para el contacto sexual. Por ejemplo, la excitación sexual ha sido condicionada en sujetos humanos emparejando un estímulo como la imagen de un frasco de centavos con imágenes de una película erótica. Experimentos similares con peces gourami azules y codornices domesticadas han demostrado que dicho condicionamiento puede aumentar el número de crías. Estos resultados sugieren que las técnicas de acondicionamiento podrían ayudar a aumentar las tasas de fertilidad en individuos infértiles y especies en peligro de extinción.

Transferencia pavloviana-instrumental

La transferencia instrumental pavloviana es un fenómeno que ocurre cuando un estímulo condicionado (CS, también conocido como "señal") que se ha asociado con estímulos gratificantes o aversivos a través del condicionamiento clásico altera la prominencia motivacional y el comportamiento operante. En un experimento típico, a una rata se le presentan parejas sonido-comida (condicionamiento clásico). Por separado, la rata aprende a presionar una palanca para obtener comida (condicionamiento operante). Las sesiones de prueba ahora muestran que la rata presiona la palanca más rápido en presencia del sonido que en silencio, aunque el sonido nunca se ha asociado con presionar la palanca.

Se sugiere que la transferencia pavloviana-instrumental desempeñe un papel en el efecto de resultados diferenciales, un procedimiento que mejora la discriminación operante al emparejar estímulos con resultados específicos.

En la cultura popular

En la novela de 1932 Brave New World de Aldous Huxley, el condicionamiento juega un papel clave en el mantenimiento de la paz social, especialmente en el mantenimiento del sistema de castas en el que se basa la sociedad. Otro ejemplo está en la novela distópica de Anthony Burgess de 1962, A Clockwork Orange, en la que el antihéroe y protagonista de la novela, Alex, se somete a un procedimiento llamado técnica Ludovico, en el que se le alimenta con una solución para causar náuseas intensas y luego se lo obliga a observar actos violentos. Esto lo hace incapaz de realizar actos violentos sin inducir náuseas similares. Sin querer, también forma una aversión a la música clásica.

Algunos ejemplos generales que involucran la teoría del condicionamiento clásico en acción incluyen, en muchos casos, la publicidad. Esta es una táctica utilizada para obtener una respuesta. La publicidad en programas de juegos es uno de los muchos ejemplos. Con el entorno emocionante y positivo de un programa de juegos, el espectador puede comenzar a generar una respuesta emocionante al anuncio debido a la asociación con el entorno. Otro ejemplo, muy similar al experimento de Pavlov, involucra la comida. Cada vez que una persona entra en la cocina, empieza a sentir hambre. Esto también puede relacionarse con comer ciertos alimentos mientras se ve una película de miedo y se convierte en asociar el terror con la comida que se estaba consumiendo en el momento de ver la película. Cualquier tipo de música, como música navideña.

Contenido relacionado

Más resultados...

Condicionamiento clásico

Definición

Investigación de Pavlov

Terminología

Formas de condicionamiento clásico

Condicionamiento hacia adelante o progresivo

Condicionamiento simultáneo

Condicionamiento de segundo orden y de orden superior

Condicionamiento hacia atrás o regresivo

Condicionamiento temporal

Procedimiento de contingencia cero

Condicionamiento de Extinción

Estímulos condicionados

Adquisición

Extinción

Inhibición externa

Recuperación de la extinción

Generalización de estímulos

Discriminación de estímulos

Inhibición latente

Supresión condicionada

Inhibición condicionada

Fase 1

Fase 2

Fase 3

Bloqueo

Fase 1

Fase 2

Prueba

Teorías sobre el condicionamiento clásico

Teoría de la sustitución del estímulo o Pavloviana

Modelo Rescorla-Wagner

Ecuación

Modelo R–W: adquisición

Modelo R–W: extinción

Modelo R–W: bloqueo

Problemas teóricos y alternativas al modelo Rescorla-Wagner

Contenido de aprendizaje

Papel de la atención en el aprendizaje.

Contexto

Teoría del comparador

Teoría computacional

Modelos basados ​​en elementos

El modelo POE

Usos del condicionamiento clásico

Base neural del aprendizaje y la memoria

Terapias conductuales

Respuesta condicionada al fármaco

Hambre condicionada

Respuesta emocional condicionada

Transferencia pavloviana-instrumental

En la cultura popular

Contenido relacionado

Modelos basados en elementos