這篇文章的寫作動機在兩年前讀過Acta Psychologica重新出版的荷蘭心理學者Adriaan de Groot論文–The meaning of “significance” for different types of research,就有動筆的想法。在鹿特丹待滿三個月,研究也稍有成果的時候,我想一起介紹心理計時學之父Franciscus Donders的代表著作。讀兩位學者的代表作,可以了解心理學者在不同時代的歷史任務,看到當時的成就如何對今日的心理科學產生影響。

讀論文看數個世代的荷蘭心理科學發展

Acta Psychologica是由在歐陸活躍的心理學者主導編輯,從1936年開始出版論文至今的實驗心理學學術期刊。1969年與2014年,首篇心理計時學論文出版一百週年以及Adriaan de Groot的百歲冥誕,Acta Psycholigca翻譯並重新出版兩位在1869與1956年以荷文在荷蘭國內研討會與心理學期刊發表的論文。我從交錯書寫兩位學者的生平與代表論文的意義,整理兩位的貢獻與今日心理科學面對的時代課題。Donders的論文是On the speed of mental processes,de Groot的論文是The meaning of “significance” for different types of research。兩篇論文皆非開放取用論文,有興趣找來閱讀的讀者請自行透過合法管道取閱。

Franciscus Cornelis Donders

Donders是1818年在Tiburg出生,大半輩子在Utrecht生活與工作的職業眼科醫師。他的醫師生涯收集許多眼球標本,解剖研究發現玻璃體(Vitreous humor)與光線折射的關係,進而提出今日眼科醫師和驗光師測量近視度數的方法,這套方法在眼科醫學被稱為Donder’s Law
心理學的學生初次認識Donders,多數來自他在1869年發表的心理計時實驗論文。這份論文整理他與當時在Utrechet University攻讀生理學的博士生De Jaager的合作成果,是有史以來人類以科學方法測量思考歷程的方法與紀錄。在這篇論文之前,科學家與哲學家都認為人類對外界刺激的反應,在神經系統中的訊息傳遞是發生在一瞬間,不可能運用科學方法測量。目前任教於以Donders為名的Donders Instituent,Radboud University的Ardi Roelofs教授,曾寫過一篇介紹當時Donders與De Jaager如何做實驗的網頁。其中著墨他們改造當時法國人Édouard-Léon Scott發明的世界第一台錄音設備,運用他們發展的減法設計,測出一個人聽到另一個人的說話,立刻說出來的時間差。Donders與學生和朋友互相擔任實驗者與受試者,收集測量的時間差是0.8秒。雖然以今日的科技規格來看並不夠精確,卻足以打破當時學術界認為神經系統訊息傳遞無法測量的想法。

再翻閱1969年的論文,我找到比Ardi Roelofs教授的介紹更值得玩味的訊息。首先是Donders的計時實驗有人聲、光線與字卡、以及腳部皮膚電擊三種版本,所有版本都有三種反應作業:(A)簡單反應;(B)選擇反應;(C)鎖定反應(Go/NoGo)。以人聲為例,簡單反應的刺激提供者只會發一種聲音(例如ku),受試者只要跟著唸。簡單反應測出的時間最短,今天稱簡單反應是心理計時實驗的基準線(baseline)。選擇反應的刺激提供者會任意發出兩種聲音(例如ku與ka),受試者跟著唸剛聽到的聲音。選擇反應測出的時間最長,因為包含辨認聲音與選擇反應聲音的心智活動。要測出選擇反應多出的心智活動要花多少時間,就要搭配鎖定反應:刺激提供者會任意發出兩種聲音(例如ku與ka),受試者只唸出其中一種聲音(例如ku),另一種聲音不必發聲。鎖定反應測出的時間介於簡單反應與選擇反應之間,Donders管鎖定反應叫c measurement,因為比起簡單反應只多一個辨認聲音的心智活動,只要每個版本的選擇反應時間減去鎖定反應,就能測量選擇聲音、光線、以及皮膚感覺的心智活動需要花費多少時間。今天的心理學學生學習Donders的計時實驗是使用個人電腦、甚至是智慧手機或平板,但是與Donders當年一樣,同學之間互相擔任實驗者與受試者,再自行分析資料,檢驗這套實驗方法的可行性。

另一個值得玩味的是Donders與De Jaager發展一系列實驗的背景。除了正好趕上當時第一代錄音與精密計時設備的問世,論文中也提到當代德國神經生理學已掌握的發現,如神經系統的解剖學,開始掌握神經細胞的電位活動紀錄方法。因此Donders的計時實驗設計雖然是測量人類行為,設計構想是奠基在當時的生理學知識之上。1868的論文見證心理計時學與近近神經生理學的歷史連結,也是成今日學習心理科學必須了解一定程度的生理學,才能充分掌握的歷史背景。Donders之後的心理計時學發展軌跡,與生理學有若即若離的關係,構成更多複雜的故事。而Donders的計時實驗,標誌荷蘭的科學家在心理學一詞尚未問世之前,就已經奠定心理科學的發展基礎。

Adriaan de Groot

認識de Groot教授的論文是2014年時曾寫過一系列談科學方法的文章(見),之後開始認識並著手進行預先登錄研究(preregistered research),而開始閱讀相關論文。這篇論文是促成我來到鹿特丹進行訪問研究的一項因素,在此生活一陣子後,發現可以從此認識今日荷蘭心理科學研究現況,以及與全球心理科學研究圈生態的關聯。我先談de Groot教授其人與論文的發表背景,再談今天再讀60年前的這篇論文有何意義。

根據維基百科的介紹,de Groot於1914年出生於北荷蘭省的小村莊Santpoort,2006年辭世。有西洋棋手與荷蘭皇家學院院士兩種身份,院士身份來自他開發運用於荷蘭初等學校教育的智力測驗。我從荷蘭心理學家Rolf Zwaan的部落格,推測至少五十歲以上的荷蘭人,唸小學時曾做過他開發的智力測驗。1956年發表的The meaning of “significance” for different types of research,提出了一個今天所有需要運用實證科學研究問題的學者,都要先認識的實證循環(emperical cycle)。在我個人的專業blog,有關這篇論文的深度閱讀心得,有詳細的介紹。

1956年是統計學假設檢定方法發展成熟,各種實證科學領域運用p值評估獲得的資料是否支持研究假說的年代。de Groot這篇論文指出實證科學研究的完整循環包括發掘有潛力假設的探索型研究(Exploratory Research),以及檢驗有潛力假設能被證據支持的驗證型研究(Confirmative Research)。假設檢定方法最適合的使用情況是只針對一種假設的驗證型研究,如果用在探索型研究,將面對想找到越多,卻越容易失敗的風險。我的深度閱讀心得使用附帶R程式碼的圖表,重現de Groot當年的這段分析。

2014年是歐美心理科學界興起預先登錄研究的重要年份。2015年被評為年度重要科學新聞的心理學的重製危機,由世界各地270位心理學者組成的Open Science Collaboration,就是在2014這一年展開撰寫研究計畫與進行實驗的核心工作。與傳統研究計畫不同之處,預先登錄研究的計畫包括分析方法的詳細設定,包括參與人數、極端值的定義、統計方法與p值的限制等。即使最後分析結果沒有達到統計顯著,也不能違反已登錄的設定增加或修改資料。如此設定是逼近de Groot在1956年所定義的驗證型研究,現在看來Acta Psychologica在2014年重新出版de Groot的論文不只有紀念的意義,也有為團隊打氣的味道,雖然最後發現只有38%的研究能被重現,成了新聞標題稱呼的危機

Reproducible Psychological Research:Dutch and World

如果未來心理科學研究的可重製度是所有研究者都要認識的課題,可從de Groot的這篇論文開始認識Open Science Collaboration的理念。這個團隊也有不少新生代荷蘭心理學家的加入,例如現在在Tiburg University攻讀心理學博士學位的Chris Hartgerink,為參與團隊的各實驗室共用的統計分析程序出了不少力。我現在訪問的University Erasmus Rotterdam心理系,合作的Rolf Zwaan教授在今年初也發表一篇與歐美11個實驗室合作,以預先登錄研究模式證實一篇2011年發表於psychological science的一篇社會心理學研究,無法重製的研究結果。目前預先登錄研究的推廣目標是劃清探索型研究與驗證型研究的分界,讓de Groot的實證循環能完整落實。從Donders到de Groot,雖然都不是心理科學歷史的耀眼巨星,但是在科學歷史的前進軌跡,他們的概念都有啟發不同世代的心理科學者前進。