O que é um cronograma de reforço?

Que impacto os cronogramas de reforço têm na aprendizagem?

O condicionamento operante é um processo de aprendizado no qual novos comportamentos são adquiridos e modificados por meio de sua associação com as consequências. Reforçar um comportamento aumenta a probabilidade de ocorrer novamente no futuro, enquanto punir um comportamento diminui a probabilidade de que ele seja repetido. No condicionamento operante , os horários de reforço são um componente importante do processo de aprendizagem.

Quando e com que frequência reforçamos um comportamento pode ter um impacto dramático na força e na taxa da resposta.

O que é um cronograma de reforço?

Então, o que exatamente é um cronograma de reforço e como funciona no processo de condicionamento? Um cronograma de reforço é basicamente uma regra que indica quais instâncias de um comportamento serão reforçadas. Em alguns casos, um comportamento pode ser reforçado toda vez que ocorre.

Às vezes, um comportamento pode não ser reforçado de todo.

Reforço positivo ou reforço negativo podem ser usados, dependendo da situação. Em ambos os casos, o objetivo do reforço é sempre fortalecer o comportamento e aumentar a probabilidade de que ele ocorra novamente no futuro.

Você pode ter uma idéia melhor de como os cronogramas de reforço funcionam, pensando em como a aprendizagem ocorre tanto nas situações de aprendizado que ocorrem naturalmente quanto nas situações de treinamento mais estruturadas.

Nas configurações do mundo real, os comportamentos provavelmente não serão reforçados a cada vez que ocorrerem. Para situações em que você está propositalmente tentando treinar e reforçar uma ação, como em sala de aula, em esportes ou em treinamento de animais, você pode optar por seguir um cronograma de reforço específico.

Como você verá abaixo, alguns agendamentos são mais adequados para determinados tipos de situações de treinamento. Em alguns casos, o treinamento pode exigir que você comece com um cronograma e mude para outro quando o comportamento desejado tiver sido ensinado. Certos esquemas de reforço podem ser mais eficazes em situações específicas.

Existem dois tipos de esquemas de reforço:

Programações de Reforço Contínuo

Em reforço contínuo, o comportamento desejado é reforçado a cada vez que ocorre. Esse cronograma é melhor usado durante os estágios iniciais de aprendizado para criar uma forte associação entre o comportamento e a resposta.

Por exemplo, imagine que você está tentando ensinar um cachorro a apertar sua mão. Durante os estágios iniciais de aprendizado, você provavelmente se manteria em um esquema de reforço contínuo para ensinar e estabelecer o comportamento. Você pode começar agarrando a pata do animal, fazendo o movimento de sacudir, dizendo "Shake" e depois oferecendo uma recompensa toda vez que executar essa sequência de passos. Eventualmente, o cão começará a realizar a ação por conta própria, e você pode optar por continuar reforçando cada resposta correta até que o comportamento esteja bem estabelecido.

Uma vez que a resposta esteja firmemente fixada, o reforço é normalmente mudado para um esquema de reforço parcial.

Programações Parciais de Reforço

No reforço parcial ou intermitente, a resposta é reforçada apenas uma parte do tempo . Comportamentos aprendidos são adquiridos mais lentamente com reforço parcial, mas a resposta é mais resistente à extinção .

Por exemplo, pense em nosso exemplo anterior em que você estava treinando um cachorro para agitar. Embora você tenha usado inicialmente um cronograma contínuo, o reforço de cada instância do comportamento pode nem sempre ser realista. Eventualmente, você pode decidir mudar para um cronograma parcial, no qual você fornecerá reforço depois que tantas respostas ocorrerem ou depois de tanto tempo ter decorrido.

Existem quatro esquemas de reforço parcial:

Programações de taxa fixa são aquelas em que uma resposta é reforçada somente após um número especificado de respostas. Esse cronograma produz uma taxa alta e constante de resposta, com apenas uma breve pausa após a entrega do reforçador. Um exemplo de um cronograma de taxa fixa seria entregar uma bolinha de comida a um rato depois de pressionar uma barra cinco vezes.

Programações de taxa variável ocorrem quando uma resposta é reforçada após um número imprevisível de respostas. Esse cronograma cria uma alta taxa constante de resposta. Jogos de azar e jogos de loteria são bons exemplos de uma recompensa baseada em um cronograma de razão variável. Em um ambiente de laboratório, isso pode envolver a entrega de pellets de alimentos a um rato após pressionar uma barra, novamente após quatro prensas de barra, e um terceiro pellet após duas prensas de barra.

Programações de intervalo fixo são aquelas em que a primeira resposta é recompensada somente após um determinado período de tempo ter decorrido. Esse cronograma provoca altas quantidades de respostas perto do final do intervalo, mas responde muito mais lentamente logo após a entrega do reforçador. Um exemplo disso em um ambiente de laboratório seria reforçar um rato com um pellet de laboratório para a primeira prensa de barras após um intervalo de 30 segundos.

Intervalos de intervalo variável ocorrem quando uma resposta é recompensada após uma quantidade imprevisível de tempo ter passado. Esse cronograma produz uma taxa lenta e constante de resposta. Um exemplo disto seria entregar um pellet de alimento a um rato após a primeira prensa de barras, seguindo um intervalo de um minuto, outro pellet para a primeira resposta após um intervalo de cinco minutos, e um terceiro pellet de alimentos para a primeira resposta após um intervalo de três minutos.

Como você escolhe um cronograma de reforço?

Decidir quando reforçar um comportamento pode depender de vários fatores. Nos casos em que você está especificamente tentando ensinar um novo comportamento, um cronograma contínuo geralmente é uma boa escolha.

Uma vez que o comportamento tenha sido aprendido, alternar para um cronograma parcial é geralmente preferível.

No cotidiano, os esquemas parciais de reforçamento ocorrem com muito mais frequência do que os contínuos. Por exemplo, imagine se você recebesse algum tipo de recompensa toda vez que aparecesse para trabalhar no horário. Em vez disso, essas recompensas são normalmente distribuídas em um cronograma de reforço parcial muito menos previsível. Esses cronogramas não são apenas muito mais realistas e fáceis de implementar, eles também tendem a produzir taxas de resposta mais altas e, ao mesmo tempo, são menos suscetíveis à extinção.

Realisticamente, reforçar um comportamento a cada vez que ocorre pode ser difícil e requer muita atenção e recursos. Programações parciais não apenas tendem a levar a comportamentos mais resistentes à extinção, mas também reduzem o risco de que o sujeito fique saciado. Se o reforçador usado não for mais desejado ou recompensador, o sujeito pode parar de realizar o comportamento desejado.

Por exemplo, imagine que você está tentando ensinar um cachorro a se sentar. Se você estiver usando comida como recompensa, o cão pode parar de realizar a ação quando estiver cheio. Em tais casos, algo como elogio ou atenção pode ser um reforço mais eficaz.

Uma palavra de

O condicionamento operante pode ser uma poderosa ferramenta de aprendizado. O cronograma de reforço utilizado durante o processo de treinamento e manutenção pode ter uma grande influência na rapidez com que um comportamento é adquirido, na força da resposta e na frequência com que o comportamento é exibido. Para determinar qual programação é preferível, é importante considerar diferentes aspectos da situação, incluindo o tipo de comportamento que está sendo ensinado e o tipo de resposta que é necessário.

> Fontes:

> Cooper, J, Heron, T e Heward, W. Applied Behavior Analysis . New Jersey: Educação Pearson; 2007.

> Nevid, JS. Fundamentos da Psicologia: Conceitos e Aplicações. Boston, MA: Cengage Learning; 2016