O que é condicionamento do operador? Definição e Exemplos

O condicionamento operante ocorre quando é feita uma associação entre um comportamento específico e uma consequência para esse comportamento. Essa associação baseia-se no uso de reforço e / ou punição para incentivar ou desencorajar o comportamento. O condicionamento operante foi definido e estudado pela primeira vez pelo psicólogo comportamental B.F. Skinner, que conduziu várias experiências bem conhecidas de condicionamento operante com sujeitos animais.

Principais tópicos: condicionamento do operador

O condicionamento operante é o processo de aprendizado por meio de reforço e punição.
No condicionamento operante, os comportamentos são fortalecidos ou enfraquecidos com base nas consequências desse comportamento.
O condicionamento operante foi definido e estudado pelo psicólogo comportamental B.F. Skinner.

Origens

B.F. Skinner era um behaviorista, o que significa que ele acreditava que a psicologia deveria se limitar ao estudo de comportamentos observáveis. Enquanto outros behavioristas, como John B. Watson, focado no condicionamento clássico, Skinner estava mais interessado no aprendizado que acontecia através do condicionamento operante.

instagram viewer

Ele observou que em respostas condicionantes clássicas tendem a ser desencadeados por reflexos inatos que ocorrem automaticamente. Ele chamou esse tipo de comportamento respondente. Ele distinguiu comportamento respondente do comportamento operante. Comportamento do operador Skinner foi o termo usado para descrever um comportamento reforçado pelas conseqüências que o seguem. Essas conseqüências desempenham um papel importante na execução ou não de um comportamento.

Skinner idéias foram baseadas em A lei de efeito de Edward Thorndike, que afirmou que o comportamento que provoca consequências positivas provavelmente será repetido, enquanto o comportamento que provoca consequências negativas provavelmente não será repetido. Skinner introduziu o conceito de reforço nas idéias de Thorndike, especificando que o comportamento reforçado provavelmente será repetido (ou fortalecido).

Para estudar o condicionamento operante, Skinner conduziu experimentos usando uma "Caixa Skinner" uma pequena caixa com uma alavanca em uma extremidade que forneceria comida ou água quando pressionada. Um animal, como um pombo ou rato, foi colocado na caixa onde estava livre para se movimentar. Eventualmente, o animal pressionaria a alavanca e seria recompensado. Skinner descobriu que esse processo resultava no animal pressionando a alavanca com mais frequência. Skinner mede o aprendizado rastreando a taxa de respostas do animal quando essas respostas são reforçadas.

Reforço e Punição

Através de suas experiências, Skinner identificou os diferentes tipos de reforço e punição que incentivam ou desencorajam o comportamento.

Reforço

O reforço que segue de perto um comportamento incentivará e fortalecerá esse comportamento. Existem dois tipos de reforço:

Reforço positivo ocorre quando um comportamento resulta em um resultado favorável, p. um cão que recebe um tratamento após obedecer a uma ordem ou um aluno que recebe um elogio do professor depois de se comportar bem na sala de aula. Essas técnicas aumentam a probabilidade de o indivíduo repetir o comportamento desejado para receber a recompensa novamente.
Reforço negativo ocorre quando um comportamento resulta na remoção de uma experiência desfavorável, por exemplo um experimentador deixa de dar a um macaco choques elétricos quando o macaco pressiona uma certa alavanca. Nesse caso, o comportamento de pressionar a alavanca é reforçado porque o macaco deseja remover os choques elétricos desfavoráveis novamente.

Além disso, Skinner identificou dois tipos diferentes de reforços.

Reforçadores primários reforçam naturalmente o comportamento porque são inatamente desejáveis, p. Comida.
Reforços condicionados reforçam o comportamento não porque sejam inatamente desejáveis, mas porque nós aprender associá-los a reforçadores primários. Por exemplo, o papel-moeda não é inatamente desejável, mas pode ser usado para adquirir bens inatamente desejáveis, como comida e abrigo.

Punição

Punição é o oposto de reforço. Quando o castigo segue um comportamento, desencoraja e enfraquece esse comportamento. Existem dois tipos de punição.

Punição positiva (ou punição por aplicação) ocorre quando um comportamento é seguido por um resultado desfavorável, por exemplo um pai espancando uma criança depois que a criança usa uma palavra de maldição.
Punição negativa (ou punição por remoção) ocorre quando um comportamento leva à remoção de algo favorável, por exemplo um pai ou mãe que nega a uma criança o subsídio semanal porque ela se comportou mal.

Embora a punição ainda seja amplamente usada, Skinner e muitos outros pesquisadores descobriram que a punição nem sempre é eficaz. A punição pode suprimir um comportamento por um tempo, mas o comportamento indesejado tende a voltar a longo prazo. A punição também pode ter efeitos colaterais indesejados. Por exemplo, uma criança que é punida por um professor pode ficar incerta e com medo, porque não sabe exatamente o que fazer para evitar futuras punições.

Em vez de punição, Skinner e outros sugeriram reforçar os comportamentos desejados e ignorar comportamentos indesejados. Reforço diz a um indivíduo qual comportamento é desejado, enquanto a punição apenas informa ao indivíduo qual comportamento não é desejado.

Modelagem do comportamento

O condicionamento operante pode levar a comportamentos cada vez mais complexos através de moldar, também conhecido como "método de aproximações". A modelagem acontece passo a passo, à medida que cada parte de um comportamento mais complexo é reforçada. A modelagem começa reforçando a primeira parte do comportamento. Uma vez que essa parte do comportamento é dominada, o reforço só acontece quando a segunda parte do comportamento ocorre. Esse padrão de reforço é continuado até que todo o comportamento seja dominado.

Por exemplo, quando uma criança é ensinada a nadar, ela pode ser elogiada inicialmente por entrar na água. Ela é elogiada novamente quando aprende a chutar e novamente quando aprende braçadas específicas. Finalmente, ela é elogiada por se impulsionar através da água executando um golpe específico e chutando ao mesmo tempo. Através deste processo, todo um comportamento foi moldado.

Horários de Reforço

No mundo real, o comportamento não é constantemente reforçado. Skinner descobriu que a frequência do reforço pode afetar a rapidez e o sucesso com que se aprende um novo comportamento. Ele especificou vários esquemas de reforço, cada um com diferentes tempos e frequências.

Reforço contínuo ocorre quando uma resposta específica segue cada desempenho de um determinado comportamento. O aprendizado acontece rapidamente com reforço contínuo. No entanto, se o reforço for interrompido, o comportamento diminuirá rapidamente e, no final das contas, terminará completamente, o que é chamado de extinção.
Agendamentos de taxa fixa comportamento de recompensa após um número especificado de respostas. Por exemplo, uma criança pode receber uma estrela após cada quinta tarefa que completa. Nesta programação, a taxa de resposta diminui logo após a entrega da recompensa.
Programações de taxa variável variar o número de comportamentos necessários para obter uma recompensa. Esse cronograma leva a uma alta taxa de respostas e também é difícil de extinguir, porque sua variabilidade mantém o comportamento. As máquinas caça-níqueis usam esse tipo de programação de reforço.
Planejamentos de intervalo fixo forneça uma recompensa após um período específico de tempo. Ser pago a cada hora é um exemplo desse tipo de cronograma de reforço. Muito parecido com o cronograma de taxa fixa, a taxa de resposta aumenta à medida que a recompensa se aproxima, mas diminui logo após o recebimento da recompensa.
Planejamentos de intervalo variável variar a quantidade de tempo entre as recompensas. Por exemplo, uma criança que recebe um subsídio em vários momentos da semana, desde que tenha apresentado alguns comportamentos positivos, segue um cronograma de intervalo variável. A criança continuará a exibir um comportamento positivo na expectativa de, eventualmente, receber sua mesada.

Exemplos de condicionamento do operador

Se você já treinou um animal de estimação ou ensinou uma criança, provavelmente já usou condicionamento operante em sua própria vida. O condicionamento operante ainda é freqüentemente usado em várias circunstâncias do mundo real, inclusive na sala de aula e em ambientes terapêuticos.

Por exemplo, um professor pode reforçar os alunos fazendo a lição de casa regularmente, periodicamente fazendo testes pop que fazem perguntas semelhantes às tarefas recentes. Além disso, se uma criança faz birra para chamar a atenção, os pais podem ignorar o comportamento e reconhecer a criança novamente quando a birra terminar.

O condicionamento operante também é usado em modificação comportamental, uma abordagem para o tratamento de vários problemas em adultos e crianças, incluindo fobias, ansiedade, urinar na cama e muitos outros. Uma maneira de implementar a modificação de comportamento é através de um economia simbólica, em que os comportamentos desejados são reforçados por tokens na forma de crachás digitais, botões, chips, adesivos ou outros objetos. Eventualmente, esses tokens podem ser trocados por recompensas reais.

Críticas

Embora o condicionamento operante possa explicar muitos comportamentos e ainda ser amplamente utilizado, existem várias críticas ao processo. Primeiro, o condicionamento operante é acusado de ser um explicação incompleta para aprender porque negligencia o papel dos elementos biológicos e cognitivos.

Além disso, o condicionamento operante depende de uma Figura autoritária reforçar o comportamento e ignora o papel da curiosidade e a capacidade de um indivíduo de fazer suas próprias descobertas. Os críticos se opõem à ênfase do condicionamento operante no controle e manipulação do comportamento, argumentando que eles podem levar a práticas autoritárias. Skinner acreditava que os ambientes naturalmente controlam o comportamento, e que as pessoas podem optar por usar esse conhecimento para o bem ou para o mal.

Finalmente, como as observações de Skinner sobre o condicionamento operante se baseavam em experimentos com animais, ele é criticado por extrapolar de seus estudos com animais para fazer previsões sobre o comportamento humano. Alguns psicólogos acreditam que esse tipo de generalização é defeituoso porque humanos e animais não humanos são fisicamente e cognitivamente diferentes.

Fontes

Cereja, Kendra. "O que é condicionamento do operador e como funciona?" Verywell Mind, 2 de outubro de 2018. https://www.verywellmind.com/operant-conditioning-a2-2794863
Crain, William. Teorias do Desenvolvimento: Conceitos e Aplicações. 5a ed., Pearson Prentice Hall. 2005.
Goldman, Jason G. “O que é condicionamento do operador? (E como isso explica dirigir cães?) ” Americano científico, 13 de dezembro de 2012. https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
McLeod, Saul. "Skinner - Condicionamento Operante." Simplesmente Psicologia, 21 de janeiro de 2018. https://www.simplypsychology.org/operant-conditioning.html#class