更新時間:2025-08-24 17:08:25作者:佚名
LI YUAN TU ZHI
荔園圖志
第26期
斯坦福大學圖書館創建新部門以支持學者的數據需求
斯坦福大學圖書館新設了研究數據服務部門,名為 Data,RDS。此部門將與校內其他單位如研究計算中心等聯手斯坦福大學圖書館,向全校的斯坦福學者提供數據支持。
RDS的成立目的在于,整合數字人文、地理空間分析、計算社會科學和統計學等領域的學術研究,同時涵蓋科學、技術、工程、數學教育等學科的數據管理,以此支持數據的完整生命周期,并促進數字學術的發展。
Peter 是那項研究數據服務的第一位助理館長,他任職斯坦福大學前,曾擔任耶魯大學圖書館數字人文實驗室的負責人,也曾在芝加哥大學負責過人文研究的計算工作。
Peter談到斯坦福大學圖書館設立RDS的原因,說明數據演變的過程,并闡述這個新部門怎樣為斯坦福大學不同領域和學科的學者提供支持。
為什么創建研究數據服務部門?
研究人員在各個領域都要處理來自多方的海量資料:既有自己進行實驗或考察所得,也有商業公司提供、政府部門以及文化保護單位等渠道的數據。這些資料形態多樣,比如抵押貸款的文件、亞馬遜雨林上空的遙感照片,或是成千上萬本已數字化的典籍。從研究工作的實際需求角度出發,比如為了保障地球能夠持續發展,都必須以采集到復雜的大規模資料集,并且能夠運用這些資料集為基本條件。
斯坦福大學圖書館旨在輔助科研人員全流程的數據活動,涵蓋數據搜尋或采集階段,涉及數據整理與優化環節,包含算法運用和量化研究時期,以及數據歸檔至存儲庫環節。該館計劃在既有常規服務之上持續進步起步網校,同時通過服務科研人員所積累的實踐認知,來規劃后續工作方向。
已有的哪些服務可促進RDS?
斯坦福地理空間中心,致力于支撐空間數據科學的相關資源;跨學科研究中心,專注于設計并構建數據工具及方法;大學圖書館,設有科學數據管理專家;以及大學圖書館,配備數字研究系統建設人員。圖書館期待這些團隊持續努力,在已有任務(涵蓋信息收集、授權、維護、歸檔和分發)上更進一步,致力于實現更明確、更便捷的線上及線下支持。
已有部門在RDS服務中支持學者的案例有哪些?
斯坦福地理空間中心是這所高校在GIS即地理信息系統以及空間數據科學領域的關鍵支撐機構,其空間技術與方法具備跨學科應用價值。比如,此類技術能夠協助海洋生物研究者描繪加利福尼亞沿岸當前海洋生物的分布格局,同時也可供研究塞勒姆女巫審判的歷史學者考察17世紀原告與被告的地理分布情況。
跨學科研究中心的成員包括各類專業技術人員,他們致力于協助特定項目或單位開展數字化學術探索工作。該中心還配備有專門從事軟件開發的工程師,他們負責為教師的研究項目打造相關應用工具。數據科學軟件與服務團隊會協助學者掌握 R 等關鍵語言,這些語言對于文本處理和數據分析至關重要。
另外,新組建的RDS部門也有職員把為數百萬的記錄數據集加以處理和豐富,使其變為研究人員能夠應用的形態,并且把它們保存在斯坦福大學圖書館的計算機中。圖書館還配備有科學館員對研究計劃所獲成果進行歸類,目的是為了同他人交流資訊。
誰可以使用 RDS,是否需要付費?
RDS 向所有斯坦福大學學者提供免費服務。對于有疑問的學生,特別是涉及多語言文本分析方面;對于感興趣的博士后,尤其是地理空間工具和數據;對于尋找數據的教職員工,尤其是相關項目,RDS 都能給予支持。
與數據打交道的過程中是否有困難或擔憂?
維護科研資料的全部過程非常有益,包括搜集或發掘,還有整理或轉化為更便于運算的狀態,也涉及對資料進行實際操作(在常規或神經網絡環境中),最終將由此產生的學術成果妥善保存為長久檔案,供后續探索和驗證。各項流程的具體實施會因領域、單位及個人經歷而存在差異,斯坦福大學圖書館有責任盡可能全面地掌握這些流程,學科專家在此過程中扮演著關鍵角色。
現在關于“大數據”的許多探討,越來越常牽涉到偏見、算法危害斯坦福大學圖書館,以及訓練數據缺乏代表性或不完整等議題。圖書館需要留意數據可能帶來的危害,期待斯坦福大學圖書館能持續作為討論這些議題和顧慮,并尋求對策的場所。
RDS 是斯坦福大學唯一提供數據和數字學術幫助的地方嗎?
不是這樣的。RDS遍布學校的各個院系和圖書館環境中,部分屬于這些學術機構,依靠各自的領域知識為科研人員提供重要的支持。比如,萊恩醫學圖書館的同事對醫學研究中的數據使用問題十分清楚,比如美國國立衛生研究院提出的新數據管理與共享規定。商學院的學術機構與藏書樓另配有見識豐富的專家隊伍,針對GSB集體給予諸多數據及探究方面的協助。再者,斯坦福大學研究計算中心(SRCC)擔當高性能運算的核心,具備海量運算和資料庫的專長、指導與閱歷,對于促進斯坦福大學的學術活動起著決定性功效。
葉蘭,翟莉莉,黃旭根據不熟悉的數據需求進行了編譯。