Aunque el conductismo puede haber perdido gran parte del dominio que tuvo durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y a menudo utilizada en el proceso de aprendizaje y modificación de la conducta.
¿Qué es el condicionamiento operante?
El condicionamiento operante, a veces denominado condicionamiento instrumental, es un método de aprendizaje que emplea premios y castigos para el comportamiento. Mediante el condicionamiento operante, se establece una asociación entre un comportamiento y una consecuencia (ya sea negativa o positiva) para ese comportamiento.
Por ejemplo, cuando las ratas de laboratorio presionan una palanca cuando se enciende una luz verde, reciben una bolita de comida como recompensa. Cuando presionan la palanca cuando la luz roja está encendida, reciben una leve descarga eléctrica. Como resultado, aprenden a pulsar la palanca cuando la luz verde está encendida y a evitar la luz roja.
Pero el condicionamiento operante no es sólo algo que tiene lugar en entornos experimentales al entrenar animales de laboratorio. También desempeña un papel importante en el aprendizaje cotidiano. El refuerzo y el castigo tienen lugar en entornos naturales todo el tiempo, así como en entornos más estructurados como las aulas o las sesiones de terapia.
La historia del condicionamiento operante
El condicionamiento operante fue descrito por primera vez por el conductista B.F. Skinner, razón por la que a veces se le llama condicionamiento skinneriano. Como conductista, Skinner creía que no era realmente necesario examinar los pensamientos y las motivaciones internas para explicar el comportamiento. En su lugar, sugería que debíamos fijarnos sólo en las causas externas y observables del comportamiento humano.
Durante la primera parte del siglo XX, el conductismo se convirtió en una fuerza importante dentro de la psicología. Las ideas de John B. Watson dominaron esta escuela de pensamiento desde el principio. Watson se centró en los principios del condicionamiento clásico, y en una ocasión sugirió que podía tomar a cualquier persona, independientemente de su origen, y entrenarla para que fuera lo que él quisiera.
Los primeros conductistas centraron su interés en el aprendizaje asociativo. Skinner estaba más interesado en cómo las consecuencias de las acciones de las personas influían en su comportamiento.
Skinner utilizó el término operante para referirse a cualquier «conducta activa que opera sobre el entorno para generar consecuencias». La teoría de Skinner explicaba cómo adquirimos la gama de conductas aprendidas que mostramos cada día.
Su teoría estaba muy influenciada por el trabajo del psicólogo Edward Thorndike, que había propuesto lo que denominó la ley del efecto. Según este principio, las acciones que van seguidas de resultados deseables tienen más probabilidades de repetirse, mientras que las que van seguidas de resultados indeseables tienen menos probabilidades de repetirse.
El condicionamiento operante se basa en una premisa bastante sencilla: las acciones que van seguidas de un refuerzo se verán reforzadas y será más probable que se repitan en el futuro. Si cuentas una historia divertida en clase y todo el mundo se ríe, es más probable que vuelvas a contar esa historia en el futuro.
Si levantas la mano para hacer una pregunta y tu profesor elogia tu comportamiento cortés, será más probable que levantes la mano la próxima vez que tengas una pregunta o un comentario. Como el comportamiento fue seguido de un refuerzo, o de un resultado deseable, la acción precedente se ve reforzada.
A la inversa, las acciones que provocan un castigo o consecuencias indeseables se debilitarán y será menos probable que se repitan en el futuro. Si vuelves a contar la misma historia en otra clase pero esta vez nadie se ríe, será menos probable que vuelvas a repetir la historia en el futuro. Si gritas una respuesta en clase y tu profesor te regaña, será menos probable que vuelvas a interrumpir la clase.
Tipos de comportamientos
Skinner distinguió entre dos tipos diferentes de comportamientos
- Los comportamientos de respuesta son aquellos que se producen de forma automática y refleja, como retirar la mano de una estufa caliente o sacudir la pierna cuando el médico le da un golpecito en la rodilla. No hay que aprender estos comportamientos. Simplemente se producen de forma automática e involuntaria.
- Las conductas operantes, en cambio, son las que están bajo nuestro control consciente. Algunos pueden producirse de forma espontánea y otros de forma intencionada, pero son las consecuencias de estas acciones las que influyen en que vuelvan a producirse o no en el futuro. Nuestras acciones en el entorno y las consecuencias de esa acción constituyen una parte importante del proceso de aprendizaje.
Aunque el condicionamiento clásico podía explicar las conductas de los encuestados, Skinner se dio cuenta de que no podía explicar gran parte del aprendizaje. En su lugar, Skinner sugirió que el condicionamiento operante tenía una importancia mucho mayor.
Skinner inventó diferentes dispositivos durante su infancia y puso estos conocimientos en práctica durante sus estudios sobre el condicionamiento operante. Creó un dispositivo conocido como cámara de condicionamiento operante, que hoy en día se conoce como caja de Skinner. La cámara podía contener un animal pequeño, como una rata o una paloma. La caja también contenía una barra o llave que el animal podía pulsar para recibir una recompensa.
Para hacer un seguimiento de las respuestas, Skinner también desarrolló un dispositivo conocido como registrador acumulativo. El dispositivo registraba las respuestas como un movimiento ascendente de una línea, de modo que los índices de respuesta podían leerse observando la pendiente de la línea.
Componentes del condicionamiento operante
Hay varios conceptos clave en el condicionamiento operante.
El refuerzo en el condicionamiento operante
El refuerzo es cualquier acontecimiento que refuerza o aumenta la conducta que sigue. Hay dos tipos de refuerzos. En ambos casos de refuerzo, la conducta aumenta.
- Los reforzadores positivos son eventos o resultados favorables que se presentan después del comportamiento. En las situaciones de refuerzo positivo, una respuesta o conducta se refuerza con la adición de un elogio o una recompensa directa. Si haces un buen trabajo y tu jefe te da una bonificación, esa bonificación es un reforzador positivo.
- Los reforzadores negativos implican la eliminación de un acontecimiento o resultado desfavorable tras la realización de una conducta. En estas situaciones, se refuerza una respuesta mediante la eliminación de algo considerado desagradable. Por ejemplo, si su hijo empieza a gritar en medio de un restaurante, pero deja de hacerlo cuando le da una golosina, su acción condujo a la eliminación de la condición desagradable, reforzando negativamente su comportamiento (no el de su hijo).
El castigo en el condicionamiento operante
El castigo es la presentación de un evento o resultado adverso que provoca una disminución del comportamiento que le sigue. Hay dos tipos de castigo. En ambos casos, el comportamiento disminuye.
- El castigo positivo, a veces denominado castigo por aplicación, presenta un acontecimiento o resultado desfavorable para debilitar la respuesta que le sigue. Los azotes por mal comportamiento son un ejemplo de castigo por aplicación.
- El castigo negativo, también conocido como castigo por eliminación, se produce cuando se elimina un evento o resultado favorable después de que se produzca un comportamiento. Quitarle el videojuego a un niño tras su mal comportamiento es un ejemplo de castigo negativo.
Horarios de refuerzo
El refuerzo no es necesariamente un proceso sencillo, y hay una serie de factores que pueden influir en la rapidez y la calidad del aprendizaje de cosas nuevas. Skinner descubrió que el momento y la frecuencia con que se reforzaban las conductas influían en la velocidad y la fuerza de la adquisición. En otras palabras, el momento y la frecuencia del refuerzo influyen en el aprendizaje de nuevas conductas y en la modificación de las antiguas.
Skinner identificó varios esquemas diferentes de refuerzo que afectan al proceso de condicionamiento operante:
- El refuerzo continuo implica la entrega de un refuerzo cada vez que se produce una respuesta. El aprendizaje tiende a producirse con relativa rapidez, aunque la tasa de respuesta es bastante baja. La extinción también se produce muy rápidamente una vez que se interrumpe el refuerzo.
- Los programas de proporción fija son un tipo de refuerzo parcial. Las respuestas se refuerzan sólo después de un número específico de respuestas. Esto suele conducir a una tasa de respuesta bastante estable.
- Los programas de intervalo fijo son otra forma de refuerzo parcial. El refuerzo se produce sólo después de que haya transcurrido un determinado intervalo de tiempo. Las tasas de respuesta se mantienen bastante estables y comienzan a aumentar a medida que se acerca el momento del refuerzo, pero se ralentizan inmediatamente después de que se haya entregado el refuerzo.
- Los programas de proporción variable son también un tipo de refuerzo parcial que implica reforzar la conducta tras un número variado de respuestas. Esto conduce a una alta tasa de respuesta y a tasas de extinción lentas.
- Los programas de intervalo variable son la última forma de refuerzo parcial descrita por Skinner. Este esquema implica la entrega de refuerzos después de que haya transcurrido una cantidad variable de tiempo. Esto también tiende a conducir a una tasa de respuesta rápida y una tasa de extinción lenta.
Ejemplos de condicionamiento operante
Podemos encontrar ejemplos de condicionamiento operante a nuestro alrededor. Pensemos en el caso de los niños que terminan los deberes para obtener una recompensa de sus padres o de su profesor, o en el de los empleados que terminan proyectos para recibir elogios o ascensos. Hay más ejemplos de condicionamiento operante en acción:
- Después de actuar en una obra de teatro comunitario, recibes los aplausos del público. Esto actúa como un refuerzo positivo que te inspira a probar más papeles de actuación.
- Puedes entrenar a tu perro para que traiga la pelota ofreciéndole elogios y una palmadita en la cabeza cada vez que realice la conducta correctamente. Este es otro refuerzo positivo.
- Un profesor les dice a los estudiantes que si tienen una asistencia perfecta durante todo el semestre, no tienen que hacer el examen global final. Al eliminar un estímulo desagradable (el examen final), se refuerza negativamente a los alumnos para que asistan a clase con regularidad.
- Si no entregas un proyecto a tiempo, tu jefe se enfada y reprende tu actuación delante de tus compañeros. Esto actúa como un castigo positivo, haciendo menos probable que termines los proyectos con retraso en el futuro.
- Una adolescente no limpia su habitación como le han pedido, por lo que sus padres le quitan el teléfono durante el resto del día. Este es un ejemplo de castigo negativo en el que se quita un estímulo positivo.
En algunos de estos ejemplos, la promesa o posibilidad de recompensas provoca un aumento del comportamiento. El condicionamiento operante también puede utilizarse para disminuir un comportamiento mediante la eliminación de un resultado deseable o la aplicación de un resultado negativo. Por ejemplo, a un niño se le puede decir que perderá los privilegios del recreo si habla fuera de turno en clase. Esta posibilidad de castigo puede conducir a una disminución de las conductas disruptivas.