조작적 조건화 (operant conditioning)

스키너의 실험 (Skinner box)

  • B.F. 스키너(B.F. Skinner)는 조작적 조건화(operant conditioning)
  • Shortcode:
  • 라고도 알려진 학습 이론을 개발한 미국의 심리학자입니다. 조작적 조건화는 동물이나 인간의 행동이 결과에 따라 어떻게 변화하는지를 설명하는 학습 이론입니다.
  • 강화 (Reinforcement) : 행동을 증가시키는 결과를 제공하는 것입니다. 정적 강화(positive reinforcement)는 원하는 행동 이후에 양적인 보상이 제공되는 경우를 말하며, 부적 강화(negative reinforcement)는 원치 않는 자극을 제거하거나 피하는 것으로 인해 행동이 증가하는 경우를 말합니다.
  • 처벌 (Punishment): 행동을 감소시키는 결과를 제공하는 것입니다. 정적 처벌(positive punishment)은 원치 않는 자극이 도입되는 경우를 말하며, 부적 처벌(negative punishment)은 원하는 자극을 제거하는 것으로 인해 행동이 감소하는 경우를 말합니다.

조작적 조건화 현상

1. 행동형성, 조성법, 행동조성 (Shaping) : 복잡한 행동을 단계적으로 학습시키는 과정을 말합니다. 먼저, 행동의 근사 형태를 강화하여 이를 기반으로 점차 원하는 행동으로 모양을 만들어갑니다. 예) 원하는 동작이 ‘박수치기’라고 하면, 처음에는 동물이 손을 들 때마다 강화를 주고, 이후에는 손을 든 것이 점점 더 박수 모양에 가까워질 때만 강화를 주는 방식으로 행동을 형성시킬 수 있습니다.

2. 미신행동, 징크스 (Superstitious Behavior) : 미신행동은 우연한 강화 또는 처벌과 특정 행동 간에 잘못된 인과 관계를 형성하는 현상입니다. 동물이나 인간이 특정 행동을 우연히 한 시점에서 강화나 처벌을 받았다고 인식하여 해당 행동을 계속 반복하게 됩니다.보상과 아무런 관련없으면서 완전히 우연히 한 행동이 강화에 선생한 경우 그 행동이 고정적으로 계속되려는 경향입니다.

3. 강화계획 (Reinforcement Schedules) : 강화계획은 강화가 일어나는 빈도와 방식을 정의합니다.

  • 고정 간격 계획 (Fixed Interval Schedule) : 일정한 시간 간격으로 강화가 제공됩니다. 반응 수에 관계없이 일정기간이 경과한 후에, 처음 나타나는 반응을 강화시키는 경우입니다. 두 강화 사이에 수행되는 반응의 수는 강화물 획득에 영향을 미치지 않습니다. 예) 매월 일정 날짜에 용돈이나 월급을 받는 경우
  • 변동 간격 계획 (Variable Interval Schedule) : 변동 간격 계획은 불규칙한 시간 간격으로 강화가 제공됩니다. 일정치 않은 시간 간격을 두고 강화를 하는 경우로서 이 계획 전체를 통해 강화가 주어지는 시간 간격의 평균은 항상 일정하게 정해집니다. 예) 일 년에 정해진 보너스 지급 일수를 불규칙한 날에 지급하는 경우
  • 고정 비율 계획 (Fixed Ratio Schedule): 특정 행동이 일정한 횟수로 발생할 때마다 강화가 제공됩니다. 행동의 강화는 특정 동작이 발생한 후 일정 횟수가 채워지면 일어납니다. 반응이 빠르고 안정적으로 나타납니다. 예) 실적에 따라 임금을 받는 경우
  • 변동 비율 계획 (Variable Ratio Schedule): 변동 비율 계획은 불규칙한 횟수로 특정 행동이 발생할 때마다 강화가 제공됩니다. 강화물을 받기 위해 요구되는 반응수가 시행에 따랄 변화하는 경우로서 가장 반응률이 높습니다. 강화물을 받는 비율은 변동적이지만, 이들 반응 수의 합을 강화의 수로 나눈 평균값으로 예를 들어 주사위 3이 나와야 돈을 받는 도박에서 3이 나올 확률은 1/6이 됩니다. 이 계획하에 훈련받은 행동은 빨리 습득되고 높은 비율로 오래 유지되는 경향이 있습니다.

4. 토큰경제 (Token Economy) : 토큰경제는 강화를 토큰이라는 중간 교환 단위를 사용하여 관리하는 시스템입니다. 토큰은 특정 행동이나 성과와 연관되어 주어지며, 이 토큰은 나중에 보상이나 특정한 권리로 교환될 수 있습니다. 토큰경제는 학교나 치료 시설에서 행동 개선이나 목표 달성을 도모하는 데 사용될 수 있습니다.

5. 프리맥의 원리 (Premack’s Principle) : 일명 그랜마의 법칙 (Grandma’s Law)이라고 불리기도 합니다. 덜 선호되는 행동을 더 선호되는 행동으로 강화할 수 있다는 개념입니다 .이 원리는 데이비드 프리맥(David Premack)에 의해 제안되었습니다. 강화의 개념을 활용하여 개인이 덜 선호하는 행동을 수행하기 위해 더 선호하는 행동을 사용할 수 있다는 아이디어입니다. 이는 더 자주 나타나는 행동을 보상으로 사용하여 덜 일어나는 행동을 증가시키는 방법을 제공합니다. 예) “네가 숙제를 끝내면 비디오 게임을 하게 해 줄게”

Author