吳滔艾
● 人口協會(Population Council)總幹事
開放資料的理念已經成為主流,儘管自由分享資料能夠帶來意義深遠的好處,但要成為普遍做法還有很長的路要走。
過去5年中,包括比爾和梅琳達蓋茨基金( Bill & Melinda Gates Foundation)、威康信託基金(Wellcome Trust)、美國國家衛生研究院(NIH)、美國國家航太總署(NASA)等主要的私人或公共研究出資機構都不約而同的制定了資料共用政策,同時間,美國的市級、州級和國家級政府一直在推動開放資料門戶。
學術出版商也接受了開放資料,部分學術期刊甚至制定了鼓勵、期望乃至要求分享資料的政策。
但共用資料的實際操作卻陷入停滯。
Figshares2017年的開放資料報告顯示,2300名接受調查的研究人員中有60%宣稱自己「經常或有時」分享資料,但選擇「經常」分享的僅占20~30%。不久前,另一項針對1200名研究人員的研究發現,只有「不到15%的研究人員在資料庫中共用資料。」
在我所研究的社會科學領域,資料開放顯然還沒有普及。
顯而易見,促進開放資料的主流政策其實行不通,政策的理念模仿夢想之地,政策想當然爾的認為如果你強制分享,人們就會遵守規定。要想真的實現變革,研究人員自己必須接受共用資料。要想實現這一目標,需要正確的資訊和激勵措施。
簡言之,我們需要的不只是大棒,還有胡蘿蔔。
毫無疑問,資料共享的要求屬於強制措施,另一種最常被引用的支援資料共用的「資料複製(replication)」也是。當然,資料複製研究至關重要,目前再生性危機正在嚴重困擾著科學。但在2016年對4600名研究人員所進行的調查中,僅31%的研究人員稱分享資料的動機是著眼於「透明度和重複使用率」。
同一項調查顯示,造成研究人員分享資料猶豫不決的主要原因包括智慧財產權或保密問題。
他們擔憂研究成果被誤讀或誤用,或者擔憂自己的研究成果會遭剽竊,鑒於目前主導學術界「出版或滅亡(publish or perish)」的生態以及所有科學家面臨的競爭性出資環境,「擁有(owning)」資料遠比分享更令人受益。
是時候將資料分享文化的對話主題從從研究人員可能「失去」什麼轉移到他們可能得到什麼,就從聲譽開始。
好消息是研究人員可以發佈資料集的資料期刊已經越來越受歡迎。
三大公開查閱期刊(包括資料簡介、生物多樣性資料期刊和科學資料)的引用量已經從2012年的區區3次飆升至2016年的1028次。
另一根「胡蘿蔔」是資料共用能最大限度地提高研究人員和資助者的投資報酬率。
目前,研究註冊機構和資料門戶的分散使得希望在具影響力期刊上發表的個人研究者很難找到類似的專案資料,因此他們更有可能將研究時間和捐贈資金浪費在與其他人完全重疊的專案。
資料共用便可以解決這個問題。
同樣為了在辛巴威對我的工作進行一次隨機評估,我和我的同事搜集了約2500名青少年和年輕人的數據。為滿足捐助者要求,我們在同行評審的期刊上發表了大約10%的相關資料,但我們卻缺少資金對資料集進行進一步的分析(這對研究人員來講是非常常見的問題)。
如果我們未使用的資料能夠被公開調閱,就可能吸引新的合作者重新啟動這項研究,還有可能啟動效果更好的分析。
研究人員使用公開共用的現有資料能夠輕鬆跨越學科,制定出更有可能導致突破性發現的研究議程和創新問題。除加速進步外,資料共用所支持的協作提高了研究人員獲取所需資金的能力,因為捐贈者更容易被跨學科的創新研究所吸引。
但要想充分利用資料共用,捐助者還應當轉變他們的思維方式並在專案實施過程中加強對高品質資料和資料搜集管理工作的投資,同時為資料集的管理和資料分析提供資金支援。應當給予研究人員充足的時間和資源來充分利用所收集的資料,從而挖掘出證據背後更深層次的故事。
資料共用的另外一個積極意義是它可以輔助未來的研究人員,讓他們可以在論文中使用我們所搜集的資料。在擔任美國國家衛生研究院研究員的早期職業生涯中,我幸運的可以訪問隸屬於NIH及約翰霍普金斯大學(Johns Hopkins University)研究人員的許多內部資料庫,我花了2年時間在各種環境下進行雙重分析,在以前工作的基礎上,我才能發表推動職涯的一系列論文。
除更好地激勵研究人員和資金捐助機構,還需要根本轉變科學文化來加速科學進步,這方面有幾項充滿希望的計畫正在開展中。
例如開放科學中心正在促進學術研究的開放性、完整性和可複製性。柏克萊社會科學透明度計畫(Berkeley Initiative for Transparency in the Social Sciences )正在提供研究透明度領域的公開資料和相關培訓,以補充加強用於決策的研究和證據。
科克倫獎勵基金會(Cochrane-REWARD prize)也正竭盡全力提高研究資金的利用率,據估算每年約有1700億美元的研究經費遭到浪費。
雖然上述舉措解決了開放資料的某些障礙,但還需要採取更多措施來確保研究人員成為資料共用背後的推動力。女童創新、研究和學習中心是我所領導的人口委員會青少年研究領域的一家全球性中心,正在建設全世界最大的青少年資料庫,研究人員機構和其他人可籍此分享和查閱逾百萬人的優質資料。
我們相信開放資料可以加速推進研究透明度和創新解決方案,上述解決方案真正影響有史以來人數最多的一代青少年(約12億)生活。我們認為隨著開放資料實踐變得越來越普遍,由此實現的共用及合作所帶來的好處將實現進一步延伸。
(原標題為《Making Open Data a Reality》,文章未經授權,請勿任意轉載)