制約原理的複習

　　今天要複習的心理學知識，是只要有接觸過心理學相關課程的人都一定聽過的--制約Conditioning（註：也有人將conditioning翻譯成條件化，在此為了方便，就統一講成制約）。

　　制約有分古典制約(Classical conditioning)跟操作制約(Operant conditioning)

　　先從古典制約開始，首先要講到俄羅斯的生理學家Ivan Pavlov和他可愛的狗狗。Ivan Pavlov原本是研究消化系統的，他認為狗狗只要接觸到食物就會流口水，所以把食物放到狗狗面前，並且裝上一個管子測量牠的唾液，大約像這樣：

　　這種情況下狗狗會流口水是非常正常的生理反射，我們稱食物為非制約刺激（又稱無條件刺激Unconditioned Stimulus），而狗狗因為食物而流口水的反應就叫非制約反應（又稱無條件反應Unconditioned Response）。簡單來說，非制約刺激與非制約反應是最天然、無加工的，不經要特別學習就會有所連結。

　　但是反覆測驗幾次之後呢，Pavlov就發現他的實驗受到奇怪的干擾：狗狗在看到食物之前，光是聽到主人把食物送來的腳步聲、看到主人的臉，就已經開始流口水了！

　　腳步聲和主人的臉，本來都不可能會讓狗狗流口水的，也不是狗狗流口水的主要原因，按理說不會造成特殊反應，我們稱之為中性刺激(Neutral Stimulus)，但是，當腳步聲、主人的臉開始反覆又反覆地與食物一起出現，或是出現的時間很接近，聰明的狗狗就會自動做出一種聯結----把腳步聲、主人的臉和食物連結在一起，這就是為什麼狗狗只要聽到腳步聲、看到主人的臉就會有反應。

　　這種經過連結而來的反應，我們稱之為制約反應（或條件反應Conditioned Response），造成制約反應的腳步聲以及主人的臉，在此就是所謂的制約刺激（或條件刺激Conditioned Stimulus），可以說這是行為主義者聯結論的學習觀點：透過反覆地聯結而學習到某種後天的反應。

　　以前有的人說考歷史的時候，如果歷史老師剛好站在原本上課很常站的位置、做了某一個很常做的動作，就會讓考生想起某一題的答案，這應該也可以說是古典制約的一種，老師（制約刺激）讓考生聯想到某一次上課內容（非制約刺激），於是能夠寫下答案（制約反應）。

　　如果再講深入一點，就會發現制約刺激與非制約刺激出現的時機，孰先孰後、同時或者僅有一部份重疊等等，對學習效果的影響非常大，如果間隔時間太長，就幾乎不會產生聯結，此外，也有所謂的第二階制約，可能讓所學、所連結的東西越來越廣泛，以狗狗實驗來說，就是在腳步聲與口水分泌產生連結之後，再讓腳步聲與其他中性刺激(e.g.紅燈)反覆配對共同出現，於是狗狗就有可能看到紅燈、想起腳步聲、想到食物然後流口水囉！

　　但這是比較困難的，而且有可能弄巧成拙導致連原本學會的東西都忘掉了。講太深就難懂了，先跳出來看看操作制約吧！

　　講到操作制約，想到的代表人物大概屬Thorndike跟Skinner。這兩個人講的東西其實非常相似，只是使用的術語不同，且Skinner是在Thorndike之後又經過幾十年的歷程才提出理論的，相對比較完整、廣博一點，所以下面這邊介紹會以Skinner的理論為主。

　　Skinner最著名的就是這個看似複雜的史金納箱子

　　這個箱子被設計來觀察老鼠和鴿子的學習過程。只要老鼠在壓下在箱子內的桿子，牠就會得到食物。

　　我們在此稱食物為「增強物(reinforcer)」，拿到增強物會正增強(reinforcement)老鼠壓下桿子的行為，起初，老鼠並不知道食物怎麼來，牠只是隨意地在箱子裡東摸摸西摸摸，久而久之，牠會在不斷地增強之後，學會「壓桿」這個行為。

　　簡言之：如果某個行為之後幾乎總伴隨著好的結果(正增強)，這個行為就會被學起來。

　　與古典制約相同，增強物出現的時機也會影響到學習行為的效果，在這邊，比較特別的是，如果老鼠不是每一次壓桿都能得到食物，偶爾有、偶爾沒有(稱為間歇增強)，強化效果反而會比較好、比較不容易消除。有人說這是賭博習慣很難戒除的原因。雖然不是每一次賭都有錢(正增強)，但是偶爾會有，於是受到間歇增強，反而更難戒。這也是很多人無法離開某些渣南渣女的原因。在他身邊並不總是幸福快樂，但是他偶爾會很好（對比之下顯得很好），受到間歇增強，於是很難離開。

　　很容易想像的是，有正增強，當然就有負增強，所謂負增強，就是用負向的方式來增強某個行為。在Skinner的實驗中，就是讓老鼠一直被電擊(負增強物)，直到牠執行實驗者預計要牠執行的行為才停止。

　　在現實生活中常見的就是：除非小孩認真念書，否則父母會唸個不停(負增強物)。

　　這跟所謂的懲罰並不一樣，懲罰是用來削弱某一個行為的。小孩在玩，父母唸個不停；這是懲罰。父母唸個不停，小孩去唸書就停下來；這是負增強。主要差異在「目標」：是要增強還是消除行為？

　稍微說明一下，雖然我覺得搞混也沒關係，但是......操作制約跟古典制約最大的差別是：古典制約是自主神經系統的反應，是被動而難以控制的；操作制約則是自己可以隨意控制的反應，需要個體主動做一些什麼才會形成。

　　以上，介紹完古典制約與操作制約，另外補充一下，為了讓學習更有效率，動物是非常厲害的，我們有所謂的「刺激類化(stimulus generalization)」能力，有點類似舉一反三的意思，就拿狗狗的例子來說：

　　牠不需要總是看到主人的臉才流口水，看到跟主人非常像的臉，牠也會流口水；聽到非常類似的腳步聲，也會流口水。刺激的特性與制約刺激越相似，就越可能引發類似的制約反應。

　　這個能力是很重要的，舉例來說，假設我們正在學習辨認顏色，如果教學者跟你說看到綠色選yes就可以拿到一百元(正增強)，那麼一般人在看到這個顏色(刺激)、這個顏色(刺激)，跟這個顏色(刺激)的時候，都應該會選yes，不會只有對一模一樣的綠色有反應。

　　這就是我們說刺激類化可以讓學習更有效率的原因（這樣才能多拿一點錢唷！）。

　　如果想要看更多制約原理的應用，請點選以下延伸閱讀▼

延伸閱讀

制約原理的應用：審美觀是這樣來的

Google Sites

Report abuse