O que é o condicionamento operante e como funciona?

Como reforço e punição modificam o comportamento

O condicionamento operante (às vezes chamado de condicionamento instrumental ) é um método de aprendizado que ocorre através de recompensas e punições por comportamento. Através do condicionamento operante, é feita uma associação entre um comportamento e uma consequência para esse comportamento.

Por exemplo, quando um rato de laboratório pressiona um botão azul, ele recebe um pote de alimento como recompensa, mas quando ele aperta o botão vermelho ele recebe um leve choque elétrico.

Como resultado, ele aprende a apertar o botão azul, mas evita o botão vermelho.

Mas o condicionamento operante não é apenas algo que acontece em ambientes experimentais durante o treinamento de animais de laboratório; Ele também desempenha um papel poderoso no aprendizado cotidiano. Reforço e punição acontecem quase todos os dias em ambientes naturais, bem como em ambientes mais estruturados, como a sala de aula ou sessões de terapia.

Vamos dar uma olhada mais de perto em como o condicionamento operante foi descoberto, o impacto que ele teve na psicologia e como ele é usado para mudar comportamentos antigos e ensinar novos.

A história do condicionamento operante

O condicionamento operante foi cunhado pelo behaviorista BF Skinner , e é por isso que ocasionalmente você pode ouvi-lo ser chamado de condicionamento skinneriano. Como behaviorista, Skinner acreditava que não era realmente necessário olhar para pensamentos e motivações internas para explicar o comportamento. Em vez disso, ele sugeriu, devemos olhar apenas para as causas externas e observáveis ​​do comportamento humano.

Durante a primeira parte do século XX, o behaviorismo tornou-se uma força importante dentro da psicologia. As idéias de John B. Watson dominaram essa escola de pensamento desde o início. Watson concentrou-se nos princípios do condicionamento clássico , uma vez que sugeriu que ele poderia aceitar qualquer pessoa independente de sua formação e treiná-la para qualquer coisa que escolhesse.

Onde os primeiros behavioristas tinham focado seus interesses na aprendizagem associativa, Skinner estava mais interessado em como as conseqüências das ações das pessoas influenciavam seu comportamento.

Skinner usou o termo operante para se referir a qualquer "comportamento ativo que opera no ambiente para gerar consequências". Em outras palavras, a teoria de Skinner explica como adquirimos a gama de comportamentos aprendidos que exibimos todos os dias.

Sua teoria foi fortemente influenciada pelo trabalho do psicólogo Edward Thorndike , que havia proposto o que ele chamou de lei do efeito . De acordo com este princípio, as ações que são seguidas por resultados desejáveis ​​são mais prováveis ​​de serem repetidas, enquanto aquelas seguidas por resultados indesejáveis ​​são menos prováveis ​​de serem repetidas.

O condicionamento operante depende de uma premissa bastante simples - ações que são seguidas de reforço serão reforçadas e mais prováveis ​​de ocorrer novamente no futuro. Se você contar uma história engraçada na aula e todo mundo rir, você provavelmente estará mais propenso a contar essa história novamente no futuro. Se você levantar sua mão para fazer uma pergunta e seu professor elogiar seu comportamento educado, você terá mais chances de levantar sua mão na próxima vez que tiver uma pergunta ou comentário.

Como o comportamento foi seguido por reforço, ou um resultado desejável, as ações precedentes são fortalecidas.

Por outro lado, ações que resultam em punição ou consequências indesejáveis ​​serão enfraquecidas e menos prováveis ​​de ocorrer novamente no futuro. Se você contar a mesma história novamente em outra classe, mas ninguém ri desta vez, será menos provável que você repita a história novamente no futuro. Se você gritar uma resposta em sala de aula e seu professor lhe censurar, então é menos provável que você interrompa a aula novamente.

Tipos de Comportamentos

Skinner distinguiu dois tipos diferentes de comportamentos

Embora o condicionamento clássico pudesse explicar os comportamentos dos respondentes, Skinner percebeu que isso não poderia explicar uma grande quantidade de aprendizado. Em vez disso, Skinner sugeriu que o condicionamento operante tinha uma importância muito maior.

Skinner inventou dispositivos diferentes durante sua infância e ele colocou essas habilidades para trabalhar durante seus estudos sobre condicionamento operante.

Ele criou um dispositivo conhecido como câmara de condicionamento operante, mais comumente referido hoje como uma caixa de Skinner . A câmara era essencialmente uma caixa que podia conter um pequeno animal como um rato ou um pombo. A caixa também continha uma barra ou chave que o animal podia pressionar para receber uma recompensa.

Para rastrear as respostas, Skinner também desenvolveu um dispositivo conhecido como registrador cumulativo. O dispositivo registrou as respostas como um movimento ascendente de uma linha, de modo que as taxas de resposta pudessem ser lidas observando a inclinação da linha.

Componentes do condicionamento operante

Existem vários conceitos-chave no condicionamento operante.

Reforço no condicionamento operante

Reforço é qualquer evento que fortaleça ou aumente o comportamento que segue. Existem dois tipos de reforços:

  1. Reforçadores positivos são eventos favoráveis ​​ou resultados que são apresentados após o comportamento. Em situações que refletem o reforço positivo, uma resposta ou comportamento é fortalecido pela adição de algo, como elogios ou recompensa direta. Por exemplo, se você fizer um bom trabalho no trabalho e seu gerente lhe der um bônus.
  2. Reforços negativos envolvem a remoção de eventos ou resultados desfavoráveis ​​após a exibição de um comportamento. Nestas situações, uma resposta é fortalecida pela remoção de algo considerado desagradável. Por exemplo, se o seu filho começar a gritar no meio da mercearia, mas parar assim que lhe der um mimo, será mais provável que lhe dê um mimo na próxima vez que ele começar a gritar. Sua ação levou à remoção da condição desagradável (a criança gritando), reforçando negativamente seu comportamento.

Em ambos os casos de reforço, o comportamento aumenta.

Punição no condicionamento operante

Punição é a apresentação de um evento ou resultado adverso que causa uma diminuição no comportamento que segue. Existem dois tipos de punição:

  1. A punição positiva , às vezes referida como punição por aplicação, apresenta um evento ou resultado desfavorável, a fim de enfraquecer a resposta que segue. Apanhar por mau comportamento é um exemplo de punição por aplicação.
  2. A punição negativa , também conhecida como punição por remoção, ocorre quando um evento ou resultado favorável é removido depois que um comportamento ocorre. Tirar o videogame de uma criança após um mau comportamento é um exemplo de punição negativa.

Em ambos os casos de punição, o comportamento diminui.

Horários de reforço

Reforço não é necessariamente um processo direto e há vários fatores que podem influenciar a rapidez e o quão bem as coisas novas são aprendidas. Skinner descobriu que quando e com que frequência os comportamentos foram reforçados, desempenhou um papel na velocidade e força da aquisição. Em outras palavras, o momento e a frequência do reforço influenciaram a maneira como os novos comportamentos foram aprendidos e como os velhos comportamentos foram modificados.

Skinner identificou vários esquemas diferentes de reforçamento que impactam o processo de condicionamento operante:

  1. Reforço contínuo envolve a entrega de um reforço a cada vez que ocorre uma resposta. Aprendizagem tende a ocorrer de forma relativamente rápida, mas a taxa de resposta é bastante baixa. A extinção também ocorre muito rapidamente quando o reforço é interrompido.
  2. Os horários de taxa fixa são um tipo de reforço parcial. As respostas são reforçadas somente após um número específico de respostas ter ocorrido. Isso normalmente leva a uma taxa de resposta bastante estável.
  3. Horários de intervalo fixo são outra forma de reforço parcial. Reforço ocorre somente após um certo intervalo de tempo ter decorrido. As taxas de resposta permanecem relativamente estáveis ​​e começam a aumentar à medida que o tempo de reforço se aproxima, mas diminuem imediatamente após o reforço ter sido entregue.
  4. Os esquemas de razão variável também são um tipo de reforço parcial que envolve um comportamento de reforço após um número variado de respostas. Isso leva a uma alta taxa de resposta e baixas taxas de extinção.
  5. Os intervalos de intervalo variável são a forma final de reforço parcial descrita por Skinner. Esse cronograma envolve o fornecimento de reforço após um período de tempo variável. Isso também tende a levar a uma rápida taxa de resposta e à lenta taxa de extinção.

Exemplos de Condicionamento Operante

Podemos encontrar exemplos de condicionamento operante no trabalho ao nosso redor. Considere o caso de crianças que completam o dever de casa para ganhar uma recompensa de um pai ou professor, ou empregados que terminam projetos para receber elogios ou promoções.

Mais alguns exemplos de condicionamento operante em ação:

Em alguns desses exemplos, a promessa ou a possibilidade de recompensas causa um aumento no comportamento, mas o condicionamento operante também pode ser usado para diminuir um comportamento. A remoção de um resultado desejável ou aplicação de resultado negativo pode ser usada para diminuir ou evitar comportamentos indesejáveis. Por exemplo, pode-se dizer a uma criança que perderá privilégios de recreio se falar fora de vez na aula. Este potencial de punição pode levar a uma diminuição nos comportamentos disruptivos.

Uma palavra de

Embora o behaviorismo possa ter perdido muito do domínio que detinha durante o início do século XX, o condicionamento operante continua sendo uma ferramenta importante e frequentemente utilizada no processo de aprendizagem e modificação do comportamento. Às vezes, consequências naturais levam a mudanças em nosso comportamento. Em outros casos, recompensas e punições podem ser conscientemente distribuídas para criar uma mudança.

O condicionamento operante é algo que você pode reconhecer imediatamente em sua própria vida, seja em sua abordagem para ensinar aos seus filhos o bom comportamento ou em treinar o cão da família para parar de mastigar seus chinelos favoritos. O importante a lembrar é que, com qualquer tipo de aprendizado, às vezes pode levar tempo. Considere o tipo de reforço ou punição que pode funcionar melhor para sua situação específica e avalie qual tipo de cronograma de reforço pode levar aos melhores resultados.

> Fontes:

> Coon, D & Mitterer, JO. Psicologia: uma jornada. Belmont, CA: Wadsworth; 2014

> Domjan, M. Os Princípios da Aprendizagem e Comportamento, sétima edição. Stamford, CT; Cengage Learning; 2015