摘要

[目的/意义]基于Re3data平台元数据对科学数据存储库的发展态势进行多维度分析和讨论,在分析结果的基础上提出推进策略,为开放科学环境下科学数据存储基础设施的进一步发展提供决策参考。[方法/过程]通过API接口采集Re3data平台2 767条元数据并进行数据清洗和构建数据集,在此基础上对国内外存储库发展从基本情况、存储库管理、存储库服务3个层面进行多维度宏观观测和扫描,并辅以微观层面上相应存储库典型代表的个案描述,从而归纳出当前数据存储库面临的挑战,并提出推进策略。[结果/结论]科学数据存储库总量呈持续增长态势;科学数据存储库内容格式、存储库类型划分更加多样;存储库技术框架、元数据标准、数据服务形式呈现出多元形式并存的局面。这些多样性和多元化的发展态势同时也带来了一定的挑战。需要构建良性循环的数据共享激励生态体系;增强异构数据存储库平台的互操作性能;推动存储库学科层面元数据标准的规范化;加强存储库数据管理人员的培训和指导,以应对多元化态势带来的挑战。

全文