海洋数据:从愿景到行动

《海洋十年数据与信息战略实施指南》

预期内容

This page aims to provide practical advice on how to implement the Ocean Decade Data and Information Strategy’s vision of a trusted, inclusive, and interconnected digital ecosystem. This digital ecosystem will make it easier to share, discover, access, and (re)use data across geographies and disciplines. The steps can be followed in any order, and multiple steps may be worked on at the same time.

You will find specific advice that endorsed Decade Actions can use to secure the data legacy of the UN Ocean Decade.

Advice for additional users with a higher level of data literacy and data management experience and expertise, such as Decade coordination bodies, National Oceanography Data Centres and Associated Data Units, and Capacity Development stakeholders, will be added on this page at a later stage.

We recognise that Decade Actions have a vast spectrum of technical ability and resourcing, and that not every data management and data sharing scenario they may encounter can be covered in these guidelines. We encourage Decade Actions to work with the Decade Coordination Office for Ocean Data Sharing when clarification is required.

We encourage Decade Actions to work with the Decade Coordination Office for Ocean Data Sharing (DCO-ODS) and their national ocean data infrastructures when clarification or specific advice is needed. 

DCO-ODS is responsible for coordinating effective knowledge and information exchange across the Ocean Decade. This coordination supports an accessible, connected, and collaborative global digital ocean ecosystem

目的与范围

The guidance in this page aims to support Decade Actions and other Decade Stakeholders implement the Data and Information Strategy and to address:

数字资源的可访问性与可用性:

提交、查找、获取和使用现有数据的困难

对不同类型数据和信息的认知不足,以及如何获取这些数据和信息

识别和理解现有数据的质量与来源所面临的挑战

数据互操作性有限,阻碍了其使用和应用

数据与知识缺口:

海洋数据仍存在显著缺口,无论从变量或数据类型,还是从时空覆盖范围来看,这些缺口既源于数据缺失,也源于数据被封存在隐蔽且无法访问的数据库中。

对不同社区所掌握的海洋相关本土及传统知识重视不足,其中大部分知识——尤其在地方层面——尚未实现数字化呈现。

资源配置与能力建设:

数据管理规划与资源配置在项目初期未被优先考虑,或其数量与质量不足,导致数据丢失或管理不善,从而削弱了投资效益。

在数字化收集、整理、管理和共享海洋数据及信息方面存在资源和能力缺口,包括缺乏受过培训的数据管理人员。

价值与认知:

在地球气候危机时期,人们普遍缺乏对数据的社会经济价值以及开放数据共享益处的理解。

如何实施海洋十年数据与信息战略

十年行动指南

本节提供切实可行的步骤,帮助您在十年行动中落实《海洋十年数据与信息战略》,并成功实现其目标。

  • Step 1. Make sure that all participants in the Decade Action are registered in OceanExpert. We also recommend that participants create an ORCID and link it to their OceanExpert record. This allows identification of participants in Decade Actions, even if their role or organisational affiliation changes. We also ask that all organisations connected to your Decade Action are registered in the Research Organization Registry (ROR) or a comparable registry providing persistent identifiers and organisational metadata

    To ensure accuracy and continued maintenance, these entries must be managed by an authorised representative of these organisations. 

    • If you are the lead or authorised representative of an organisation: Check whether your organisation already exists in ROR. If not, follow ROR guidelines to request a new record or update an existing one.
    • If you are not the lead or authorised representative of an organisation: Do not create or modify records yourself without confirmation. First search the ROR registry, and if needed, raise the request with the appropriate person within the organisation.

    More information on how to search, add, or update records is available here.

    One benefit of this approach is to ensure we have consistency in spelling and description of an organisation across the Decade’s digital ecosystem. Please inform the Decade Coordination Office for Ocean Data Sharing (DCO-ODS) of all OceanExpert entries and ROR records for your Decade Action, or contact DCO-ODS if you are experiencing any difficulty with this step.

  • 若您的十年行动不涉及数据或信息的收集、创建或使用:您 无需继续阅读,本十年行动的数据与信息战略仅针对涉及数据或信息收集、创建或使用的行动方案。 

    If you do collect, create or use data or information in your Decade Action, please follow Step 2: Make sure to have a Data Management Plan (DMP) for your project and make it available in a system such as AquaDocs or Zenodo to enable full transparency in the data sharing process.

    During this planning process, be sure to consider and clearly specify in your DMP the type of data you are collecting, creating, or reusing, as this will determine the repository you can select for publishing your data (Step 3). The chosen repository should also be clearly indicated in the DMP.

    A Data Management Plan is an official summary document that outlines how data will be handled throughout the lifecycle of a research project or initiative.

    它是 对于确保数据质量、促进归档以及实现数据交换与整合至区域或全球数据集至关重要。 

    DMPs must be an accurate reflection of an Action’s data management, and as such, should be a live document that is updated when needed, and all their versions should be made available.

    国际奥委会的数据管理计划指南可在此处获取 此处

    DMP在线工具

  • 步骤3.制定数据管理计划(DMP)后,请联系海洋数据共享十年协调办公室(DCO-ODS)以:

    Step 3.1. Identify the type of data you’re collecting and the suitable repositories for it and discuss with DCO-ODS suitable repositories to submit your (meta)data to, and allow a connection with IOC’s data discovery systems:

    根据数据类型不同,最常见的存储库示例包括:

    In this context, a suitable repository is understood to be a publicly accessible repository with long-term archiving and distribution services. Where possible, it should enable open access to the data. 

    In some cases, data might need to be confidential or under usage and distribution restrictions. Efforts should be made to make data “as open as possible, as closed as necessary”, with metadata available to explain any restrictions made and who to contact to negotiate access when possible.

    如果您的数据集与 基本海洋变量(EOV) (例如溶解氧、营养盐、无机碳、浮游植物生物量与多样性、海面高度等),请查阅 GOOS规范表中获取指导。

    若您处理其他类型的数据(如社会经济数据或公民科学数据),请参考海洋十年计划制定的指南与信息:

    Step 3.2. Identify and connect with your National Oceanography Data Centre (NODC) and/or Associated Data Unit (ADU) to allow for long-term preservation of your data and to simplify connection to the global ocean digital ecosystem.

    Even if they cannot host the data themselves, they should be aware of it for coordination purposes with the DCO-ODS. Well-maintained metadata catalogues are essential in this effort.

    If the NODC cannot store the data, contact DCO-ODS for discussion about suitable approaches.  

    Step 3.3. Describe the quality of your (meta)data:

    ✔️ Check that data is complete, well-labelled (be clear and concise when labelling variables or files, use standardised, open vocabularies where possible) – keep in mind your dataset could be reused by someone else. Where data are not complete, attempt to include explanations for why this is the case in associated metadata and in the DMP to help others understand. 

    ✔️ Make sure your datasets are stored and released in widely known formats using open standards (such as CSV, with clear headers, NetCDF, JSON, and others described in the link). Avoid proprietary or customised formats that require specific software or uncommon expertise to access and use effectively

    ✔️ Note that many Repositories have their own data standardisation and formatting requirements. Ensure these are kept in mind and included in your DMP, to ensure that submission to these repositories is possible and does not require more effort than necessary.

    ✔️优先采用相关领域已使用或定义的知名数据共享标准,以最大化数据集的复用价值;如有疑问,请联系数据协调办公室-开放数据系统(DCO-ODS)和/或 国际海洋学数据与信息交换中心(IODE) 获取支持。

    步骤 3.4.审查数据集的许可

    在共享数据时,许可协议至关重要,因为它能明确界定数据的使用方式,确保法律清晰度、正确归属,并促进开放、公平、透明和负责任的数据再利用。数据所有者应清晰阐述并传达许可条款,使数据存储库和用户明确 自身权利与义务:

    • 优先使用开放许可协议(CC, ODC, ODbL等)进行标注,并说明可能的使用限制及其他所需的权限或限制。
    • If you work with Indigenous and local knowledge, ensure you have permission from the communities to share the data and give them correct acknowledgment using appropriate mechanisms.
    • 若十年行动计划需要协助确定应为其数据添加何种标准数据许可,请咨询海洋数据共享十年协调办公室。
  • 步骤4. 与数据控制官-操作数据系统(DCO-ODS)及存储库协作,确保数据归档工作 

    步骤4.1. 通过向IODE网络(国家海洋学数据中心;关联数据单元;海洋生物多样性信息系统节点)的现有数据基础设施提交数据,连接全球系统。

    If vital (meta)data would be lost in harmonisation when submitting data to repositories, Decade Actions are also encouraged to deposit raw data in a generalist repository.

    Step 4.2. Work with your data repository to assign Persistent Identifiers such as DOIs to your datasets. Here we use “Persistent Identifiers” to mean long-lasting references to objects on the internet, such as datasets. They may change the location they take users to so that the object the point to can be moved without the need for a new identifier, making them useful for applications such as citation of datasets in scientific papers or other reports.

    This step will continue building up trust in your data so it can be reused and combined with other data to create new information, and be used in decision-making.

什么是本十年的数据和信息战略?

随着越来越多旨在借助新型传感器、自主平台及多样化技术收集海洋测量与监测数据的举措涌现,数据格局正变得日益复杂。为应对这一挑战,建立通用标准、增强互操作性并深化合作伙伴关系至关重要——这些正是海洋十年计划正在积极推进的优先事项。

海洋十年数据与信息战略

To support the Ocean Decade’s work, the Data Coordination Group developed the Data and Information Strategy to encourage the exchange of interoperable, reliable, accessible, and timely ocean data and other digital resources. Its implementation represents a huge opportunity to transform the way ocean data and information are produced, shared, managed, and used globally and equitably.

我们鼓励致力于实现数字海洋生态系统愿景的社区和个人,在支持海洋十年行动的过程中,跨越区域、经济、部门、文化、学科及其他分歧,建立并保持有意义的开放合作。

数据与信息战略的愿景是:到2030年,我们将拥有:
一个值得信赖、包容且互联互通的海洋数据与信息生态系统,该系统将被积极用于决策制定,以支持可持续的海洋管理。

战略旨在通过以下方式实现2030年既定愿景:
为推动面向解决方案的全球数字化转型,我们需要克服十年挑战,从而构建所需的数字生态系统。

目标

为实现数据与信息战略的愿景和使命,需达成以下 五大战略目标: 

构建海洋数字生态系统,促进数据、信息和知识的共享与公平获取。

提升海洋数字生态系统中的数据发现与可用性

建立对跨洋数字生态系统中共享数据和信息的信任

优先采用支持可持续海洋管理决策的数字化解决方案

拓展、赋能并动员全球社区,共同推进并维护数字海洋

实施计划如何与其他信息保持一致?

《数据与信息战略实施计划》是国际海洋学委员会与海洋十年计划发布的一系列文件组成部分,该计划阐述了构建海洋数字生态系统的愿景、战略、实施路径及具体细节。

资源配置

海洋十年计划为其十年行动和机构提供了多种能力建设机会,例如海洋匹配平台

海洋匹配器是一个创新的网络平台,旨在连接 海洋科学项目、技术及保护项目与 资助方。

如何获取更多帮助?

海洋数据共享十年协调办公室(DCO-ODS)支持十年行动在数据与信息管理及共享领域的工作,促进十年期间各项举措所产生的数据、信息及数字知识之间的持续数字互操作性。

DCO-ODS方法旨在:

将十年行动与国家十年委员会(NDCs)与国家和区域海洋数据设施相连接

制定关于海洋主题数据共享实践与方法的指导方针(包括数据管理规划、数据归属及引用规范)

通过培训、网络研讨会和能力建设机会,培育并支持全球海洋数据管理实践社区

DCO-ODS提供多种工具以支持十年行动:

您是否需要数据共享、数据检索或数据管理方面的支持?快来探索 海洋十年 数据资源工具包

找不到问题的解决方案?请前往海洋十年数据共享服务台咨询我们的数据专家。

最佳实践:一种在已知基准测试中,相较于具有相似目标的其他方法,能够持续且可验证地表现更优的方法。任何宣称某方法为最佳实践的声明,均应由独立第三方进行验证,且所有测试结果与文档须公开可查。

能力建设:指在该过程中,实体的某些能力得以建立或扩展(例如建立新的超级计算中心以提供更强的计算能力)。

能力建设:指在某实体能力得到增强的过程中,常会间接提升其他实体的能力(例如:超级计算中心的运营优化,在计算能力保持不变的同时,释放出人力与电力资源用于其他用途)。

CARE原则:集体利益/控制权限/责任担当/伦理规范。这套数据原则及其子原则共同为数据与数字系统提供了指导,旨在化解原住民社区面临的两难困境:1)保护原住民对其数据(包括传统知识)的权利与利益;2)支持开放数据、机器学习、广泛数据共享及大数据计划。

协同设计:一种协作流程,其中特定设计任务的执行者将非设计师(尤其是最终用户)纳入引导式设计流程的参与者行列。协同设计流程的目标在于减少对用户需求的预设,确保这些需求尽早且深度地融入设计实现。

数据:一组值、符号或标记(记录于任何类型的载体上),用于表示实体的一个或多个属性,或该实体的整体。例如:传感器生成的数值、模型或分析得出的数值、调查问卷中输入的文本、物理对象上的符号铭文,或文档的原始文本。注:该术语范围包含“元数据”,即关于数据的数据。 "主体数据"(相对于"元数据")特指关于目标实体的数据,即数据所描述的"主体"。

Data repository: Online platform used to deposit completed datasets with the purpose to publish, share and/or preserve them. Personal websites and databases as well as cloud storage services (Dropbox, Google Drive, etc) are not considered repositories. (Ghent University, n.d.)

数据素养:指个人有效发现、获取、审查、评估、理解、创建、(再)利用及处理数据的能力。数据素养与数字素养密切相关,但其关注的是个人处理数据本身的能力,而非使用数据的工具。

数字生态系统:一种分布式、自适应、开放的社会技术系统,具备与自然生态系统相似的自组织、永续性和可扩展性特征,包含:1) 存储、处理、共享或以其他方式处理数据的相互关联技术元素;2) 操作和治理这些元素的人类社群。 万维网是数字生态系统的典型范例,私有服务器网络亦属此类。根据各组成部分的技术兼容性与治理机制,数字生态系统可能呈现不同程度的碎片化。随着碎片化程度降低(例如通过数据联合实现),数字生态系统可逐步演进为数据织构、湖仓架构、数据空间或类似的多系统架构。

FAIR原则:可发现性/可访问性/互操作性/可复用性:一套数据原则及其子原则,旨在指导数据与数字系统如何在网络化系统中实现更高效的协作。

互操作性(数据)数据集在多个独立系统间与其他数据进行有效处理时所展现的特性。高度互操作的数据需采用特定格式呈现,包含语义标记及其他属性,使独立系统能够以最少的资源消耗、人工干预或转换操作理解并处理该数据。

开放数据:指任何人都能为任何目的访问、利用、编辑和(重新)共享的数据,且该数据附带开放许可协议。

持久标识符:对资源的长期(通常至少十年)引用。当代持久标识符(PID)可通过网络操作实现,以URL或URL片段形式存储,但并非必须如此。

质量:针对某个实体所作的断言,该断言表达该实体相对于某项标准或标准集而言的优劣程度。

质量保证:指代理人运用既定标准或体系对某实体进行评估的流程。通过质量保证流程中嵌入的质量控制环节的实体,将被认定为符合后续处理或交付给其他代理人的要求。

质量控制:评估实体是否符合标准或理想状态的过程。该过程还可能包含根据实体是否达到或超越基于标准或理想状态制定的标准,对其进行接纳或拒绝的决策。

唯一标识符:一种具有极高唯一性概率的标识符。

数据资源工具包

您是否需要数据共享、数据检索或数据管理方面的支持?快来探索 海洋十年 数据资源工具包

数据共享服务台

找不到问题的解决方案?请前往海洋十年数据共享服务台咨询我们的数据专家。

术语表

最佳实践:一种在已知基准测试中,相较于具有相似目标的其他方法,能够持续且可验证地表现更优的方法。任何宣称某方法为最佳实践的声明,均应由独立第三方进行验证,且所有测试结果与文档须公开可查。

能力建设:指在该过程中,实体的某些能力得以建立或扩展(例如建立新的超级计算中心以提供更强的计算能力)。

能力建设:指在某实体能力得到增强的过程中,常会间接提升其他实体的能力(例如:超级计算中心的运营优化,在计算能力保持不变的同时,释放出人力与电力资源用于其他用途)。

CARE原则:集体利益/控制权限/责任担当/伦理规范。这套数据原则及其子原则共同为数据与数字系统提供了指导,旨在化解原住民社区面临的两难困境:1)保护原住民对其数据(包括传统知识)的权利与利益;2)支持开放数据、机器学习、广泛数据共享及大数据计划。

协同设计:一种协作流程,其中特定设计任务的执行者将非设计师(尤其是最终用户)纳入引导式设计流程的参与者行列。协同设计流程的目标在于减少对用户需求的预设,确保这些需求尽早且深度地融入设计实现。

数据:一组值、符号或标记(记录于任何类型的载体上),用于表示实体的一个或多个属性,或该实体的整体。例如:传感器生成的数值、模型或分析得出的数值、调查问卷中输入的文本、物理对象上的符号铭文,或文档的原始文本。注:该术语范围包含“元数据”,即关于数据的数据。 "主体数据"(相对于"元数据")特指关于目标实体的数据,即数据所描述的"主体"。

Data repository: Online platform used to deposit completed datasets with the purpose to publish, share and/or preserve them. Personal websites and databases as well as cloud storage services (Dropbox, Google Drive, etc) are not considered repositories. (Ghent University, n.d.)

数据素养:指个人有效发现、获取、审查、评估、理解、创建、(再)利用及处理数据的能力。数据素养与数字素养密切相关,但其关注的是个人处理数据本身的能力,而非使用数据的工具。

数字生态系统:一种分布式、自适应、开放的社会技术系统,具备与自然生态系统相似的自组织、永续性和可扩展性特征,包含:1) 存储、处理、共享或以其他方式处理数据的相互关联技术元素;2) 操作和治理这些元素的人类社群。 万维网是数字生态系统的典型范例,私有服务器网络亦属此类。根据各组成部分的技术兼容性与治理机制,数字生态系统可能呈现不同程度的碎片化。随着碎片化程度降低(例如通过数据联合实现),数字生态系统可逐步演进为数据织构、湖仓架构、数据空间或类似的多系统架构。

FAIR原则:可发现性/可访问性/互操作性/可复用性:一套数据原则及其子原则,旨在指导数据与数字系统如何在网络化系统中实现更高效的协作。

互操作性(数据)数据集在多个独立系统间与其他数据进行有效处理时所展现的特性。高度互操作的数据需采用特定格式呈现,包含语义标记及其他属性,使独立系统能够以最少的资源消耗、人工干预或转换操作理解并处理该数据。

开放数据:指任何人都能为任何目的访问、利用、编辑和(重新)共享的数据,且该数据附带开放许可协议。

持久标识符:对资源的长期(通常至少十年)引用。当代持久标识符(PID)可通过网络操作实现,以URL或URL片段形式存储,但并非必须如此。

质量:针对某个实体所作的断言,该断言表达该实体相对于某项标准或标准集而言的优劣程度。

质量保证:指代理人运用既定标准或体系对某实体进行评估的流程。通过质量保证流程中嵌入的质量控制环节的实体,将被认定为符合后续处理或交付给其他代理人的要求。

质量控制:评估实体是否符合标准或理想状态的过程。该过程还可能包含根据实体是否达到或超越基于标准或理想状态制定的标准,对其进行接纳或拒绝的决策。

唯一标识符:一种具有极高唯一性概率的标识符。

延伸阅读

海洋十年

我们想要的海洋所需的科学

联系我们

下一个活动

订阅我们的通讯

机会

加入 #海洋十年

隐私偏好

当您访问我们的网站时,网站可能会通过您的浏览器存储来自特定服务的信息,通常以 Cookie 的形式存储。您可以在此更改您的隐私偏好。值得注意的是,阻止某些类型的 cookie 可能会影响您在我们网站上的体验以及我们能够提供的服务。

出于性能和安全考虑,我们使用 Cloudflare
所需

在浏览器中启用/禁用 Google Analytics 跟踪代码

在浏览器中启用/禁用 Google 字体

在浏览器中启用/禁用嵌入视频

隐私政策

我们的网站使用 cookie,主要来自第三方服务。请确定您的隐私偏好和/或同意我们使用 cookie。
海洋十年