Condicionamento Instrumental

Outro Termo para Condicionamento Operante

O condicionamento instrumental é outro termo para o condicionamento operante , um processo de aprendizado descrito pela primeira vez por BF Skinner . No condicionamento instrumental, reforço ou punição são usados ​​para aumentar ou diminuir a probabilidade de que um comportamento ocorra novamente no futuro.

Exemplos de condicionamento instrumental

Por exemplo, se uma aluna é recompensada com elogios toda vez que ela levanta a mão na sala de aula, ela fica mais propensa a levantar a mão novamente no futuro.

Se ela também é repreendida quando fala fora do turno, ela se torna menos propensa a interromper a aula. Nesses exemplos, o professor está usando reforços para fortalecer o comportamento e a punição de levantar as mãos para enfraquecer o comportamento de falar fora de vez.

O condicionamento instrumental é frequentemente usado também em treinamento animal. Por exemplo, treinar um cachorro para apertar as mãos envolve oferecer uma recompensa toda vez que o comportamento desejado ocorrer.

Uma breve história do condicionamento instrumental

O psicólogo EL Thorndike foi um dos primeiros a observar o impacto do reforço em experimentos com gatos. Durante esses experimentos, Thorndike observou um processo de aprendizado a que ele se referiu como aprendizado de “tentativa e erro”.

Os experimentos envolveram colocar um gato faminto em uma caixa de quebra-cabeças e, para se libertar, o gato teve que descobrir como escapar. Thorndike observou quanto tempo demorou os gatos a se libertarem em cada tentativa experimental.

Inicialmente, os gatos se engajaram em métodos de escape ineficazes, arranhando e cavando nas laterais ou no topo da caixa. Eventualmente, a tentativa e erro levaria os gatos a empurrar ou puxar com sucesso a rota de fuga. Após cada tentativa sucessiva, os gatos se engajaram cada vez menos nos comportamentos de escape ineficazes e responderam mais rapidamente com as ações corretas de fuga.

Thorndike se referiu a suas observações como a Lei do Efeito . A força de uma resposta aumenta quando é imediatamente seguida por um "satisfatório" (reforçador). Por outro lado, ações que são seguidas por efeitos desagradáveis ​​têm maior probabilidade de serem enfraquecidas.

Nos experimentos de caixa de quebra-cabeça de Thorndike, escapar da caixa era o mais satisfatório. Toda vez que os gatos escapavam com sucesso da caixa, o comportamento que imediatamente precedia a fuga era reforçado e fortalecido.

O trabalho de Thorndike teve um tremendo efeito na pesquisa posterior de BF Skinner sobre o condicionamento operante . Skinner chegou a criar sua própria versão das caixas de quebra-cabeças de Thorndike, às quais ele se referiu como uma câmara operante, também conhecida como caixa de Skinner .

Como funciona o condicionamento instrumental

Skinner identificou dois tipos principais de comportamentos. O primeiro tipo é comportamentos respondentes. Estas são simplesmente ações que ocorrem reflexivamente sem qualquer aprendizado. Se você tocar em alguma coisa quente, imediatamente irá retirar sua mão em resposta. O condicionamento clássico enfoca esses comportamentos respondentes. Nos experimentos clássicos de Pavlov com cães , a saliva para a apresentação de alimentos era o comportamento do respondente. Ao formar uma associação entre o som de um sino e a apresentação de comida, Pavlov foi capaz de treinar cães para realmente salivar simplesmente ao som daquele sino.

Skinner percebeu que, embora o condicionamento clássico pudesse explicar como os comportamentos dos respondentes poderiam levar ao aprendizado, ele não poderia explicar todo tipo de aprendizado. Em vez disso, ele sugeriu que foram as conseqüências de ações voluntárias que levaram à maior quantidade de aprendizado.

O segundo tipo de comportamento é o que Skinner chamou de comportamento operante. Ele definiu estes como todo e qualquer comportamento voluntário que age no ambiente para criar uma resposta. Estes são os comportamentos voluntários que estão sob nosso controle consciente. Estas são também ações que podem ser aprendidas. As conseqüências de nossas ações desempenham um papel importante no processo de aprendizagem.

Reforço e Punição

Skinner identificou dois aspectos-chave do processo de condicionamento operante. O reforço serve para aumentar o comportamento, enquanto a punição serve para diminuir o comportamento.

Existem também dois tipos diferentes de reforço e dois tipos diferentes de punição. Reforço positivo envolve a apresentação de um resultado favorável, como dar uma criança um tratamento depois que ela limpa seu quarto. O reforço negativo envolve a remoção de um estímulo desagradável, como dizer a uma criança que, se ela comer todas as batatas, não precisará comer o brócolis. Como a criança considera o brócolis uma consequência desagradável e ingerir a batata leva à remoção dessa conseqüência indesejável, ingerir as batatas é reforçado negativamente.

Punição positiva significa aplicar um evento desagradável depois de um comportamento. Apanhar, por exemplo, é um exemplo comum de punição positiva. Este tipo de punição é frequentemente referido como punição por aplicação. Uma consequência negativa é aplicada diretamente para reduzir o comportamento indesejado.

Punição negativa envolve tirar algo agradável depois que um comportamento ocorre. Por exemplo, se uma criança não consegue limpar seu quarto, seus pais podem dizer a ela que ela não pode ir ao shopping com seus amigos. Tirar a atividade desejável age como um punidor negativo no comportamento anterior.