今天要複習的心理學知識,是只要有接觸過心理學相關課程的人都一定聽過的--制約Conditioning(註:也有人將conditioning翻譯成條件化,在此為了方便,就統一講成制約)。
制約有分古典制約(Classical conditioning)跟操作制約(Operant conditioning)
先從古典制約開始,首先要講到俄羅斯的生理學家Ivan Pavlov和他可愛的狗狗。Ivan Pavlov原本是研究消化系統的,他認為狗狗只要接觸到食物就會流口水,所以把食物放到狗狗面前,並且裝上一個管子測量牠的唾液,大約像這樣:
這種情況下狗狗會流口水是非常正常的生理反射,我們稱食物為非制約刺激(又稱無條件刺激Unconditioned Stimulus),而狗狗因為食物而流口水的反應就叫非制約反應(又稱無條件反應Unconditioned Response)。簡單來說,非制約刺激與非制約反應是最天然、無加工的,不經要特別學習就會有所連結。
但是反覆測驗幾次之後呢,Pavlov就發現他的實驗受到奇怪的干擾:狗狗在看到食物之前,光是聽到主人把食物送來的腳步聲、看到主人的臉,就已經開始流口水了!
腳步聲和主人的臉,本來都不可能會讓狗狗流口水的,也不是狗狗流口水的主要原因,按理說不會造成特殊反應,我們稱之為中性刺激(Neutral Stimulus),但是,當腳步聲、主人的臉開始反覆又反覆地與食物一起出現,或是出現的時間很接近,聰明的狗狗就會自動做出一種聯結----把腳步聲、主人的臉和食物連結在一起,這就是為什麼狗狗只要聽到腳步聲、看到主人的臉就會有反應。
這種經過連結而來的反應,我們稱之為制約反應(或條件反應Conditioned Response),造成制約反應的腳步聲以及主人的臉,在此就是所謂的制約刺激(或條件刺激Conditioned Stimulus),可以說這是行為主義者聯結論的學習觀點:透過反覆地聯結而學習到某種後天的反應。
以前有的人說考歷史的時候,如果歷史老師剛好站在原本上課很常站的位置、做了某一個很常做的動作,就會讓考生想起某一題的答案,這應該也可以說是古典制約的一種,老師(制約刺激)讓考生聯想到某一次上課內容(非制約刺激),於是能夠寫下答案(制約反應)。
如果再講深入一點,就會發現制約刺激與非制約刺激出現的時機,孰先孰後、同時或者僅有一部份重疊等等,對學習效果的影響非常大,如果間隔時間太長,就幾乎不會產生聯結,此外,也有所謂的第二階制約,可能讓所學、所連結的東西越來越廣泛,以狗狗實驗來說,就是在腳步聲與口水分泌產生連結之後,再讓腳步聲與其他中性刺激(e.g.紅燈)反覆配對共同出現,於是狗狗就有可能看到紅燈、想起腳步聲、想到食物然後流口水囉!
但這是比較困難的,而且有可能弄巧成拙導致連原本學會的東西都忘掉了。講太深就難懂了,先跳出來看看操作制約吧!
講到操作制約,想到的代表人物大概屬Thorndike跟Skinner。這兩個人講的東西其實非常相似,只是使用的術語不同,且Skinner是在Thorndike之後又經過幾十年的歷程才提出理論的,相對比較完整、廣博一點,所以下面這邊介紹會以Skinner的理論為主。
Skinner最著名的就是這個看似複雜的史金納箱子
這個箱子被設計來觀察老鼠和鴿子的學習過程。只要老鼠在壓下在箱子內的桿子,牠就會得到食物。
我們在此稱食物為「增強物(reinforcer)」,拿到增強物會正增強(reinforcement)老鼠壓下桿子的行為,起初,老鼠並不知道食物怎麼來,牠只是隨意地在箱子裡東摸摸西摸摸,久而久之,牠會在不斷地增強之後,學會「壓桿」這個行為。
簡言之:如果某個行為之後幾乎總伴隨著好的結果(正增強),這個行為就會被學起來。
與古典制約相同,增強物出現的時機也會影響到學習行為的效果,在這邊,比較特別的是,如果老鼠不是每一次壓桿都能得到食物,偶爾有、偶爾沒有(稱為間歇增強),強化效果反而會比較好、比較不容易消除。有人說這是賭博習慣很難戒除的原因。雖然不是每一次賭都有錢(正增強),但是偶爾會有,於是受到間歇增強,反而更難戒。這也是很多人無法離開某些渣南渣女的原因。在他身邊並不總是幸福快樂,但是他偶爾會很好(對比之下顯得很好),受到間歇增強,於是很難離開。
很容易想像的是,有正增強,當然就有負增強,所謂負增強,就是用負向的方式來增強某個行為。在Skinner的實驗中,就是讓老鼠一直被電擊(負增強物),直到牠執行實驗者預計要牠執行的行為才停止。
在現實生活中常見的就是:除非小孩認真念書,否則父母會唸個不停(負增強物)。
這跟所謂的懲罰並不一樣,懲罰是用來削弱某一個行為的。小孩在玩,父母唸個不停;這是懲罰。父母唸個不停,小孩去唸書就停下來;這是負增強。主要差異在「目標」:是要增強還是消除行為?
稍微說明一下,雖然我覺得搞混也沒關係,但是......操作制約跟古典制約最大的差別是:古典制約是自主神經系統的反應,是被動而難以控制的;操作制約則是自己可以隨意控制的反應,需要個體主動做一些什麼才會形成。
以上,介紹完古典制約與操作制約,另外補充一下,為了讓學習更有效率,動物是非常厲害的,我們有所謂的「刺激類化(stimulus generalization)」能力,有點類似舉一反三的意思,就拿狗狗的例子來說:
牠不需要總是看到主人的臉才流口水,看到跟主人非常像的臉,牠也會流口水;聽到非常類似的腳步聲,也會流口水。刺激的特性與制約刺激越相似,就越可能引發類似的制約反應。
這個能力是很重要的,舉例來說,假設我們正在學習辨認顏色,如果教學者跟你說看到綠色選yes就可以拿到一百元(正增強),那麼一般人在看到這個顏色(刺激)、這個顏色(刺激),跟這個顏色(刺激)的時候,都應該會選yes,不會只有對一模一樣的綠色有反應。
這就是我們說刺激類化可以讓學習更有效率的原因(這樣才能多拿一點錢唷!)。
如果想要看更多制約原理的應用,請點選以下延伸閱讀▼