Introducción
El interés por profundizar en el tema de los reforzadores primarios y secundarios surgió durante una clase del Curso de Formación para Educadores Caninos, mientras hablábamos con los alumnos sobre la importancia de pasar rápidamente de un programa de razón continua a uno de razón intermitente.
Tradicionalmente, enseño que es necesario reducir el reforzamiento continuo al mínimo tiempo posible y migrar hacia esquemas de razón fija, entendiendo estos como programas de razón de reforzamiento, no de intervalo.
Durante esa clase surgió la reflexión de que, si bien hablamos habitualmente de la programación del reforzador primario, en la práctica también ajustamos la entrega del reforzador secundario, especialmente cuando trabajamos encadenamientos. Inicialmente reforzamos cada conducta con un secundario y un primario, pero progresivamente variamos la frecuencia de la entrega de ambos reforzadores. Así, fortalecemos los comportamientos, logramos mayor persistencia, y construimos cadenas de conducta más largas y estables.
A partir de esa observación, me surgió la duda específica: ¿qué sucede cuando, para una misma conducta, programamos el reforzador primario bajo una razón variable, pero el secundario bajo una razón fija? ¿Cómo impacta esta diferenciación en el entrenamiento?
La experiencia práctica me mostró que, de hecho, solemos trabajar así: por ejemplo, puede haber cinco repeticiones de una conducta, y en todas se entrega reforzador secundario, pero el primario aparece sólo en la segunda y la cuarta. O bien se entrega secundario solo en dos de esas cinco y primario al final. Es decir, trabajamos con razones distintas para cada tipo de reforzador, aun sin pensarlo de forma deliberada.
Qué ocurre en la práctica profesional con los reforzadores
El mantenimiento prolongado del reforzamiento continuo genera dos problemas principales: el debilitamiento de la conducta en ausencia de la recompensa visible y la aparición de un fenómeno que podría describirse como un «chantaje conductual», donde el perro sólo ejecuta conductas si percibe la presencia inmediata de la comida o del estímulo asociado
Esto refuerza la dependencia del reforzador primario como estímulo discriminativo y debilita la fuerza real del comando o del reforzador secundario. Por estas razones, considero crucial no solo comprender la adquisición de reforzadores secundarios, sino también analizar cómo distintos programas de razón aplicados de manera diferenciada a primarios y secundarios pueden afectar la estabilidad, la persistencia y la autonomía de las conductas entrenadas.
Marco Teórico
Un reforzador primario es aquel que no está condicionado, es decir, que no pasó por un proceso de aprendizaje previo y que normalmente satisface necesidades básicas del perro. Comida, agua, refugio, y en algunos casos el contacto social, son considerados reforzadores primarios porque satisfacen necesidades intrínsecas del animal.
Por su parte, un reforzador secundario es un estímulo condicionado, asociado a un reforzador primario a través de un proceso de condicionamiento clásico. Gracias a esa asociación, el reforzador secundario adquiere funcionalidad para operar como si fuera el reforzador primario. Este proceso requiere repeticiones y una programación adecuada para que el estímulo secundario conserve su capacidad de reforzar.
Dentro del entrenamiento canino, los reforzadores secundarios tienen un rol estratégico. Permiten no depender exclusivamente del reforzador primario y facilitan una economía de reforzadores más eficiente.
Razones de reforzamiento
Cuando una conducta ya está instalada, no resulta práctico ni necesario seguir reforzándola continuamente con un primario de alto valor. El reforzador secundario, entonces, permite mantener la conducta activa sin saturar o desvalorizar el reforzador primario, y sin fomentar que el perro caiga en la ley del mínimo esfuerzo. Sin embargo, el uso del reforzador secundario también presenta limitaciones y riesgos.
Si se entrega de manera reiterada sin que aparezca el reforzador primario en algún momento, el estímulo condicionado puede perder su valor y dejar de funcionar como reforzador efectivo. En consecuencia, las conductas pueden debilitarse tanto en frecuencia como en calidad.
El mantenimiento adecuado del valor del reforzador secundario se vuelve aún más importante cuando se transita hacia programas de razón intermitente. El secundario funciona en este contexto como una especie de guía, una señal de «siga la flecha», que indica al perro que, si continúa realizando las conductas pedidas, eventualmente accederá al reforzador primario. Sin un mantenimiento apropiado —por ejemplo, si se alargan demasiado las cadenas de conductas reforzadas solo secundariamente— el riesgo de deterioro en la respuesta es alto.
En la práctica cotidiana, uno de los errores más frecuentes que se observan en entrenadores es la dificultad para abandonar los esquemas de razón continua. Aun en conductas donde el perro ya tiene un alto nivel de competencia, muchos siguen entregando reforzadores primarios en cada respuesta.
El Problema de no pasar a razón intermitente
Esta falta de transición hacia programas intermitentes no solo compromete la autonomía del perro en las respuestas, sino que también genera fenómenos de chantaje conductual. Los perros aprenden que si no hay reforzador inmediato (por ejemplo, comida visible), entonces no tienen motivos para responder, ya que eso que pretendíamos usar como reforzador primario, ahora en nuestra mano, funciona como estímulo discriminativo.
Esto deteriora la calidad y consistencia de las conductas, y obliga al entrenador o tutor a recurrir a estímulos discriminativos más visibles o evidentes para mantener la ejecución.
El problema de fondo no es únicamente la falta de reforzamiento intermitente del primario, sino también la falta de un uso estratégico del reforzador secundario como herramienta de mantenimiento de la motivación y de la expectativa de refuerzo.
Diferenciación de la programación entre reforzadores primarios y secundarios
La reflexión que origina este ensayo surgió a partir de una observación práctica realizada en el contexto de entrenamiento de conductas individuales y encadenadas. Tradicionalmente, al enseñar una nueva conducta, se suele reforzar cada ejecución con un reforzador secundario (como un click o un «muy bien») seguido de un reforzador primario (como comida). Posteriormente, para consolidar la conducta, se transiciona hacia esquemas de reforzamiento intermitente, disminuyendo la frecuencia del reforzador primario.
Sin embargo, en la práctica cotidiana, no solo se modifica la programación del reforzador primario: también, muchas veces de manera intuitiva o no del todo consciente, se modifica la programación del reforzador secundario. Así, puede ocurrir que en un ejercicio como el «sentado» se omita el marcador verbal en algunas repeticiones, se lo incluya en otras, y se entregue reforzador primario a intervalos distintos.
Esta situación plantea una pregunta técnica central: ¿qué ocurre cuando la programación del reforzador primario y la del reforzador secundario no coinciden? Específicamente, ¿qué impacto tiene reforzar una misma conducta bajo un esquema de razón variable para el primario y de razón fija para el secundario, o viceversa?
Desde la experiencia práctica
Se observa que esta variabilidad no parece afectar inmediatamente la ejecución de conductas bien establecidas, sobre todo en contextos de encadenamiento, donde el reforzador secundario mantiene la expectativa de obtener un primario tras completar una serie de respuestas. Sin embargo, en fases iniciales de aprendizaje o en conductas aisladas, esta desincronización entre programas podría generar ambigüedad o debilitamiento si no se administra con criterio técnico.
Si se analiza esta desincronización como una fotografía aislada del proceso, podría parecer que estamos trabajando con razones distintas para cada tipo de reforzador. Pero si se la observa como una película —como una secuencia funcional—, lo que ocurre se asemeja más a un encadenamiento: una estructura en la que cada respuesta se sostiene por el valor acumulado de los reforzadores anteriores, y donde el secundario mantiene vigente la expectativa de acceso al primario.
¿Qué pasa en el encadenamiento?
En el caso concreto de los encadenamientos, la variación en las razones de reforzamiento parece facilitar la construcción de cadenas largas y sólidas, siempre que se mantenga un reforzador secundario activo como guía intermedia. En cambio, en conductas aisladas aún no consolidadas, podría comprometerse la claridad del entrenamiento si el secundario no sostiene consistentemente su valor y su función de «señal de camino hacia el reforzador primario».
Esta reflexión sugiere que, si bien la independencia en la programación de reforzadores primarios y secundarios es viable y funcional en muchos casos, debe hacerse considerando el nivel de consolidación de la conducta, el historial de reforzamiento del perro y la estructura del programa de trabajo.
Esta práctica revela una realidad más compleja: el reforzador secundario no mantiene siempre una función fija, sino que puede migrar, dependiendo del contexto, hacia nuevas funciones dentro del sistema de entrenamiento. ¿Qué implica esto en términos técnicos y cómo puede impactar nuestras decisiones?
Discusión y Conclusiones
La reflexión planteada en este ensayo pone en evidencia una problemática frecuente en el entrenamiento canino: la sobredependencia del reforzador primario y la falta de programación estratégica del reforzador secundario.
Aunque se reconoce ampliamente en la teoría la necesidad de transicionar del reforzamiento continuo al intermitente, en la práctica cotidiana esta transición suele aplicarse únicamente al reforzador primario, descuidando la programación del reforzador secundario.
Este descuido favorece fenómenos como el chantaje conductual, donde el perro responde sólo ante la presencia visible del reforzador primario, debilitando el valor funcional del estímulo discriminativo formal (por ejemplo, la señal verbal «sentado»). La consecuencia no es solo una menor autonomía en la respuesta, sino también una progresiva degradación de la calidad y persistencia de las conductas aprendidas.
En este contexto, la importancia del reforzador secundario trasciende su rol de marcador inmediato: funciona como una herramienta fundamental para sostener cadenas de conducta relativamente extensas, para mantener la motivación en esquemas de razón intermitente, y para reforzar la expectativa de éxito en el perro incluso cuando el acceso al reforzador primario se demora.
¿Cuándo un reforzador secundario deja de reforzar y pasa a señalar? Una transición funcional interesante
Al revisar la arquitectura del entrenamiento con más detalle, empecé a preguntarme por la función exacta que cumple el reforzador secundario dentro de una secuencia de encadenamiento.
Técnicamente, un reforzador secundario es un estímulo condicionado: adquiere su valor por asociación con un reforzador primario, y se ubica como consecuente de una conducta. Pero si analizamos su uso dentro de encadenamientos, donde no siempre va seguido de un reforzador primario, las cosas no son tan claras.
Sabemos que todo estímulo discriminativo es un estímulo condicionado. Un estímulo discriminativo, por definición, señala que hay disponibilidad de un consecuente para cierta conducta. Y aunque su lugar es antecedente (A-B-C), su valor está anclado a una historia de consecuencias.
Entonces, ¿qué ocurre cuando el reforzador secundario no es seguido de un reforzador primario durante varios ensayos dentro de un encadenamiento? ¿Sigue cumpliendo su rol de reforzador o empieza a actuar como estímulo discriminativo?
Cuando el reforzador secundario no es seguido de un reforzador primario durante varios ensayos
Este punto me resulta especialmente interesante. Por ejemplo, si en cada eslabón de la cadena digo “muy bien” pero solo aplico el reforzador primario al final, ese “muy bien” sigue siendo técnicamente un estímulo condicionado, pero funcionalmente empieza a actuar como señal de tránsito, como marcador intermedio que guía al perro hacia el siguiente paso. En la medida en que pierde su vínculo inmediato con el reforzador primario, puede empezar a operar más como estímulo discriminativo que como reforzador secundario.
Dicho de otro modo: no deja de ser un estímulo condicionado, pero su función se desplaza. Ya no refuerza la conducta anterior (¿o sí?), sino que se convierte en señal de que viene algo más. Esta transición funcional —de refuerzo condicionado a estímulo discriminativo— no es abrupta, ni necesariamente problemática, pero sí exige tener claridad en la planificación.
Si no se vuelve a emparejar a tiempo el vínculo entre el reforzador secundario y el primario, ese reforzador secundario puede perder completamente su función reforzante y quedar como una señal de transición, o sin mucho valor, o incluso irrelevante.
Entonces, la pregunta no es solo cuántas veces se puede usar un reforzador secundario sin emparejarlo nuevamente con un reforzador primario antes de que se extinga su efecto, sino cuántas veces puede ser emitido sin reforzador primario antes de que cambie su función dentro del sistema de encadenamiento.
¿El reforzador secundario es un simple marcador?
En ese punto, deja de actuar como consecuente y empieza a instalarse como antecedente, como guía o como puente hacia el próximo comportamiento. Esta reflexión no apunta a cuestionar su uso, sino a profundizar en la comprensión de lo que realmente ocurre dentro de un encadenamiento.
Tal vez, en lugar de pensar al reforzador secundario como un simple marcador, conviene analizarlo como un elemento transicional, que puede sostener funciones mixtas —a veces refuerzo condicionado, a veces estímulo discriminativo—, según el momento del proceso, la consolidación de la conducta y la expectativa construida en el perro.
Finalmente, el análisis sugiere que la programación diferenciada de reforzadores primarios y secundarios —siempre que se haga con criterio técnico— puede ser no solo viable sino deseable. Aplicar esquemas de razón diferente para el primario y el secundario, en función del nivel de consolidación de la conducta, de la estructura del encadenamiento y del estado motivacional del perro, permite construir comportamientos más sólidos, resistentes a la extinción y menos dependientes de la recompensa inmediata.
El fortalecimiento consciente del reforzador secundario, su programación estratégica y su reemparejamiento periódico con el reforzador primario se presentan entonces como aspectos esenciales para un entrenamiento canino profesional, ético y técnicamente consistente.
Epílogo práctico
Para quienes aún sienten que este enfoque puede resultar excesivamente técnico, conviene cerrar con un ejemplo práctico. Pensemos en el entrenamiento del “junto”, entendido como simplemente caminar con el perro al lado, sin tensar la correa, sin adelantarse y sin ser algo estricto o rígido.
En una etapa inicial, podemos reforzar cada paso del guía con un «muy bien» (reforzador secundario) seguido de comida (reforzador primario). Luego, a medida que el perro progresa, decidimos reforzar sólo cada dos pasos, y luego cada cuatro.
Aquí surgen varias preguntas: ¿seguimos diciendo «muy bien» en cada paso o sólo en los pasos que van a ir seguidos de comida? ¿Y si seguimos diciendo «muy bien» a cada paso, pero sólo damos comida en algunos? ¿Estamos encadenando? ¿Estamos usando razones distintas para cada reforzador? ¿El «muy bien» sigue siendo un reforzador condicionado o empieza a actuar como un estímulo discriminativo?
Este ejemplo sirve para ilustrar que incluso quienes sostienen que el reforzador secundario debería aparecer tras cada conducta, en la práctica también trabajan con lógicas donde eso no siempre ocurre.
La razón no es negligencia, sino que en esos casos el reforzador secundario empieza a cumplir otra función. Tal vez ya no señala simplemente que viene el primario, sino que comienza a funcionar como guía dentro de un encadenamiento. Este tipo de dinámicas, lejos de invalidar la función del secundario, nos invita a analizar con mayor precisión su uso en programas complejos de entrenamiento.
Reflexiones finales: funciones cambiantes del reforzador secundario, ambigüedad funcional y desafíos técnicos
La escritura de este ensayo no solo tuvo como objetivo sistematizar observaciones técnicas surgidas en la práctica, sino también invitar a cuestionamientos más amplios sobre cómo pensamos el uso de reforzadores primarios y secundarios en el entrenamiento profesional.
Uno de los planteos más relevantes surgió al preguntarnos: ¿cuántas veces puede usarse un reforzador secundario sin ser emparejado nuevamente con el primario antes de que pierda su efecto? Esta pregunta, que inicialmente parece referirse al riesgo de reversión del emparejamiento, o quizás al principio de desvanecimiento, en realidad nos lleva a un terreno más complejo. Porque no se trata solo de si el secundario pierde fuerza, sino de cómo cambia su función cuando no es seguido por el primario.
De reforzador secundario a estímulo discriminativo
En un entrenamiento bajo esquemas de razón intermitente, especialmente en encadenamientos, el reforzador secundario (por ejemplo, un “muy bien”) puede mantener su eficacia, aunque no esté seguido de inmediato por un reforzador primario.
Pero esto nos lleva a otra pregunta: ¿cuándo deja de ser un reforzador secundario y empieza a comportarse más como un estímulo discriminativo? Si el perro comienza a interpretar ese estímulo no como consecuencia reforzante, sino como señal de que está más cerca del reforzador, su función cambia, y se transforma en una especie de “señal de tránsito” que indica dirección, no recompensa.
Desde un punto de vista técnico, todo estímulo discriminativo es también un estímulo condicionado, pero no todos los estímulos condicionados cumplen la función de discriminativos. Lo interesante aquí es que el mismo estímulo ( un click o un “muy bien”) puede migrar funcionalmente de una categoría a otra, dependiendo del contexto, del historial de reforzamiento y del criterio del entrenador.
Esto nos lleva a otro aspecto aún más desafiante: ¿qué ocurre cuando un reforzador secundario ha sido asociado a múltiples reforzadores primarios? Por ejemplo, si un perro ha recibido “muy bien” seguido de comida, juego, caricias o acceso a correr, ¿qué representa ese “muy bien”?
Desde el punto de vista del condicionamiento clásico
Estamos ante un estímulo condicionado de segundo orden generalizado, que no anticipa un único estímulo incondicionado, sino que adquiere valor propio por su asociación repetida con múltiples reforzadores primarios.
Esto puede enriquecer su poder motivacional, pero también introduce ambigüedad: el perro podría esperar comida y recibir juego, o viceversa. La falta de precisión sobre cuál reforzador está disponible puede generar frustración o debilitamiento de la asociación si no se maneja con cuidado.
Al enfrentar estas complejidades, muchos entrenadores —con o sin intención consciente— apelamos a otro recurso: la creación de contextos diferenciados que ayudan al perro a anticipar qué tipo de reforzador podría aparecer.
Aunque no siempre sean diseñados como parte formal del plan de entrenamiento, estos contextos funcionan como señales adicionales que enriquecen el sistema discriminativo del perro y lo orientan dentro de una economía de reforzadores más flexible.
En algunos casos, los entrenadores incorporamos, de forma deliberada o intuitiva, estímulos discriminativos informales o señales contextuales que permiten al perro anticipar qué tipo de reforzador será más probable en una situación determinada. Estos estímulos pueden ser: el lugar donde se trabaja, el tono de voz del entrenador, el tipo de correa, el uso de un juguete visible, o incluso el momento del día.
Diferenciación contextual
Aunque no son señales explícitas como un “click” o un “muy bien”, funcionan como estímulos discriminativos al estar asociados históricamente a la disponibilidad de un reforzador específico (comida, juego, contacto social).
Desde el punto de vista del perro, esta diferenciación contextual le permite ajustar su expectativa y motivación. Por ejemplo, si ciertas rutinas de entrenamiento suelen terminar con juego, y otras con comida, el perro puede discriminar qué reforzador es más probable en base al contexto sin necesidad de una señal formal.
Esto conecta con el concepto de condicionamiento de segundo orden generalizado, donde un mismo estímulo condicionado (como un reforzador secundario) ha sido emparejado con varios reforzadores primarios diferentes. Aun así, el perro puede desarrollar expectativas específicas sobre qué reforzador está disponible en función del entorno, sin que eso implique una ambigüedad funcional.
Algunas objeciones
Finalmente, para el lector más ortodoxo, puede surgir la objeción de que lo planteado aquí confunde cadenas de conductas con conductas de duración. Por ejemplo, en el entrenamiento del “junto”, ¿estamos reforzando pasos separados o una sola conducta prolongada de caminar al lado del guía? Un teórico podría decir que es una sola respuesta mantenida, y por lo tanto basta con un único reforzador (primario o secundario) al final.
Sin embargo, desde el enfoque propuesto en este texto, esa posición desconoce la complejidad práctica del comportamiento: el perro ajusta constantemente su posición, responde a microvariaciones del guía y mantiene atención activa. Por eso, aunque el “junto” pueda analizarse como una conducta con duración, su ejecución implica decisiones repetidas, y por lo tanto puede ser modelada y reforzada como una cadena de microrespuestas.
En ese contexto, la diferenciación entre razón de reforzamiento para el secundario y para el primario no solo es válida, sino funcional, permitiendo mantener la motivación sin saturar el uso del reforzador principal.
Lo mismo ocurre en conductas como el “toque” versus el “mantener el toque”, donde el criterio pasa de una acción puntual a una permanencia activa, latente. La decisión sobre si estamos ante una sola conducta mantenida o ante una sucesión de respuestas no puede resolverse solo desde la teoría, sino que requiere un análisis funcional y contextual, y una mirada desde la experiencia del perro.
La práctica nos muestra algo que la teoría muchas veces simplifica en exceso: los reforzadores secundarios no son entes fijos, sino estímulos funcionales que migran de rol según el contexto, el historial del perro y la estructura del entrenamiento. No siempre refuerzan. A veces guían, a veces anticipan, a veces sostienen. Y eso no los hace menos válidos, sino más complejos. Comprender esta dinámica es lo que separa un protocolo estándar de un trabajo profesional ajustado a la realidad.
Entonces, ¿qué estás reforzando realmente cuando decís “muy bien”? ¿Lo que el perro hizo? ¿Lo que querés que vuelva a hacer? ¿O ya dejó de reforzar y está señalando lo que viene después? ¿Cuántas veces puede tu reforzador secundario mantenerse sin emparejarse antes de cambiar de función? ¿Y cuántas veces lo ignoras, creyendo que sigue cumpliendo la misma función?
Tal vez no se trate de reforzar más ni mejor, sino de mirar más fino. De entender no solo lo que damos, sino lo que generamos. Porque ahí se juega algo más que una técnica: se juega cómo leemos el comportamiento, cómo planeamos el entrenamiento y cuánto entendemos de lo que realmente estamos reforzando.
Pablo Capra – Escuela Canina Selva 2025




