開放在開始

2021元旦隨筆

2020年雖然失去與國外朋友直接互動的機會,在國內推動開放及可重製科學卻稍有小成。2021年在許多方面將邁入新的階段,值得在這個時刻盤點這幾年累積下來的觀察與想法,好清理出接下來要繼續的方向該不該走?要怎麼走?

大約是2012到2013年之間,我注意到許多跨國協作再現專案的公開資訊,也對這些專案採用資料科學方法處理心理學研究資料產生興趣。當時,甚至是現在的台灣社會科學學術界對於採用開放規模進行學術研究,依然不是主流。同樣在那兩年,我注意到台灣民間及新創圈,已經開始類似的行動。最著名的是2006年起由台灣開放源始碼社群推動的年度活動COSCUP 開源人年會,早期參與者已經成為產官學到社運界的指標人物。開放源始碼社群組織與推動方案的行為,非當接近我有接觸的國外開放科學實踐者。隨著接觸越深,以及實踐經驗的累積,我逐漸了解兩者中心思想的差異。或者說,對於「開放」的想像有本質的不同。

開放源始碼社群的組成初衷是促進軟體產品開發者與使用者之間的交流,透過開放程式碼以及公開的學習活動與模組,雙方共同提昇產品品質。發展至今不僅是獨立開發的小型免費或付費軟體,大型商業軟體也正在採用開源模式更新產品:近年最知名的產品如微軟的Power BI。有關這些開源軟體的開發模式,我不會也無法深入剖析其中社群如何形成與執行共同約定的開放行為準則,但我理解到開放源始碼社群的行動力源自開發者與使用者對於產品品質的共同要求,參與者的合作、批評、檢驗、回饋等行動都會反映在持續疊加的更新紀錄,以及活躍的開源論壇。學術界以大量數據分析為知識產物的幾個領域,例如人工智慧、計算語言學等,是最先向開放源始碼社群效法的學術團隊。這些團隊的成員也會採用開源模式公開他們的專案成果,但是透過與他們以及與與開放科學實踐者的親身接觸經驗比較,我體認到兩者存在的差別。這是這篇隨筆特別想談的重點,我姑且稱呼這些學術團隊的組成人士開源學術人,以便說明他們與開放科學實踐者的行動力源頭分別是什麼。

如果讀者同意開放源始碼社群的原動力是促進開發者與使者共同維護與提昇產品品質,開源學術人的專業目標從一開始就有相似的追求。人工智慧的模型與具體應用,都要經過服務對象或同行人士的試用與檢測;計算語言學的專案成果能讓有需要的各方人士使用或著做其他用途的開發。開源學術人的知識產品的受益對象相當具體,受益對象直接反應他們的使用經驗與建議,也能提昇開源學術人的專業能力,社會影響力也很好評估。因此我認為開源學術人採取開源行為的原動力與任何學術人士一樣,都是來自最早決定進入學術志業的初衷。

開放科學實踐者也是學術界的一份子,難道行為原動力不也是來自進入學術志業的原始動機?除此之外,我認為還多了更高一層的關懷:那是關心現在從事的這一門學科,能不能留下讓下一波學術工作者,在經得起考驗的基礎上,延續與拓展這門學科的課題邊界。像我所從事的認知心理學研究,還有多數社會科學領域,研究成果的受益對象相當模糊,應用用途也要等待有見識的人來發掘與發明。

所以開放科學實踐者以透明開放的方式公開研究內容的每個細節,中心思想是提供他人完整的檢驗資料,加速受益對象獲得資源或啟發的過程:除了論文分析報告與結果檔案、要公開的資料還有原始資料檔案、分析程式腳本、實驗資料收集腳本、以及各版本計畫書等。過去這兩年與開放科學實踐者合作的專案經驗,讓我學到現在符合最高開放標準的研究專案,是從計畫一開始就以開放規模佈置各種檔案的管理。2016年由基層科學家合作提出的FAIR科學資料管理與保管指南,是實踐者給全球科學實驗室主持人及成員的參考指南。我的新年方向之一是實踐與推廣FAIR指南,思考清楚我接受這套指南的原動力是什麼,才能說服我的合作者與推廣對象,為什麼要認識與採用FAIR在參與的科學研究項目。

!登入個人github帳號就能留言!