Данные об океане: от видения к действию
Руководство по реализации Стратегии по данным и информации в рамках Десятилетия океана
Чего ожидать
This page aims to provide practical advice on how to implement the Ocean Decade Data and Information Strategy’s vision of a trusted, inclusive, and interconnected digital ecosystem. This digital ecosystem will make it easier to share, discover, access, and (re)use data across geographies and disciplines. The steps can be followed in any order, and multiple steps may be worked on at the same time.
Здесь вы найдёте конкретные рекомендации, которые могут использовать организации, участвующие в инициативе «Декада действий», для сохранения наследия «Декады ООН по океанам».
На данном этапе на этой странице будут размещены рекомендации для дополнительных пользователей, обладающих более высоким уровнем грамотности в области данных, а также опытом и знаниями в сфере управления данными, таких как координационные органы «Декады», национальные центры океанографических данных и связанные с ними подразделения по данным, а также заинтересованные стороны, занимающиеся развитием потенциала.
Мы понимаем, что участники инициатив «Десятилетия» обладают широким спектром технических возможностей и ресурсов и что не все сценарии управления данными и их обмена, с которыми они могут столкнуться, могут быть охвачены в настоящих руководящих принципах. Мы рекомендуем участникам инициатив «Десятилетия» обращаться в Координационный офис «Десятилетия» по обмену океаническими данными в случае необходимости получения разъяснений.
We encourage Decade Actions to work with the Decade Coordination Office for Ocean Data Sharing (DCO-ODS) and their national ocean data infrastructures when clarification or specific advice is needed.
DCO-ODS is responsible for coordinating effective knowledge and information exchange across the Ocean Decade. This coordination supports an accessible, connected, and collaborative global digital ocean ecosystem
Цель и сфера применения
The guidance in this page aims to support Decade Actions and other Decade Stakeholders implement the Data and Information Strategy and to address:
Доступность и удобство использования цифровых ресурсов:
Трудности с представлением, поиском, доступом и использованием существующих данных
Недостаточная осведомленность о различных типах доступных данных и информации и о том, как получить к ним доступ
Проблемы с определением и пониманием качества и происхождения существующих данных
Ограниченная совместимость данных, что затрудняет их использование и применение
Пробелы в данных и знаниях:
По-прежнему существуют значительные пробелы в данных об океане, как по переменным или типам данных, так и с точки зрения пространственного и временного охвата, поскольку данные отсутствуют или в настоящее время хранятся в скрытых, недоступных базах данных.
Недооценка знаний коренных народов и традиционных знаний различных сообществ об океане, большинство из которых – особенно на местном уровне – не представлены в цифровом формате.
Ресурсы и потенциал:
Планирование управления данными и выделение ресурсов не являются приоритетными задачами на начальном этапе или являются недостаточными по количеству и качеству, что приводит к потере или неэффективному управлению данными и снижению эффективности инвестиций.
Существуют пробелы в ресурсах и потенциале для сбора, систематизации, управления и обмена данными и информацией об океане в цифровом формате, в том числе нехватка обученного персонала по управлению данными.
Ценность и осведомленность:
Общее непонимание социально-экономической ценности данных и преимуществ открытого обмена данными в период глобального климатического кризиса
Как реализовать Стратегию по данным и информации в рамках Десятилетия океанов
Руководство по действиям в рамках Десятилетия
В этом разделе представлены практические шаги, которые помогут вам применить Стратегию по данным и информации в рамках Десятилетия океана в вашей деятельности в рамках Десятилетия и успешно достичь ее целей.
1. Добро пожаловать в Десятилетие океанов! Вы теперь одобрены.
Step 1. Make sure that all participants in the Decade Action are registered in OceanExpert. We also recommend that participants create an ORCID and link it to their OceanExpert record. This allows identification of participants in Decade Actions, even if their role or organisational affiliation changes. We also ask that all organisations connected to your Decade Action are registered in the Research Organization Registry (ROR) or a comparable registry providing persistent identifiers and organisational metadata.
To ensure accuracy and continued maintenance, these entries must be managed by an authorised representative of these organisations.
- If you are the lead or authorised representative of an organisation: Check whether your organisation already exists in ROR. If not, follow ROR guidelines to request a new record or update an existing one.
- If you are not the lead or authorised representative of an organisation: Do not create or modify records yourself without confirmation. First search the ROR registry, and if needed, raise the request with the appropriate person within the organisation.
More information on how to search, add, or update records is available here.
One benefit of this approach is to ensure we have consistency in spelling and description of an organisation across the Decade’s digital ecosystem. Please inform the Decade Coordination Office for Ocean Data Sharing (DCO-ODS) of all OceanExpert entries and ROR records for your Decade Action, or contact DCO-ODS if you are experiencing any difficulty with this step.
2. Собираете ли, создаете ли или используете ли вы данные или информацию в рамках вашей Десятилетней программы действий?
Если вы не собираете, не создаете и не используете данные или информацию в рамках вашей деятельности в рамках Десятилетия: вам не нужно продолжать, поскольку Стратегия Десятилетия в области данных и информации ориентирована на деятельность в рамках Десятилетия, которая включает сбор, создание или использование данных и информации.
If you do collect, create or use data or information in your Decade Action, please follow Step 2: Make sure to have a Data Management Plan (DMP) for your project and make it available in a system such as AquaDocs or Zenodo to enable full transparency in the data sharing process.
В ходе этого процесса планирования обязательно учитывайте и четко указывайте в плане управления данными (DMP) тип данных, которые вы собираете, создаете или повторно используете, поскольку от этого зависит выбор хранилища для публикации ваших данных (шаг 3). Выбранное хранилище также должно быть четко указано в плане управления данными (DMP).
3. Как управлять данными об океане
Шаг 3. После того, как у вас будет план управления данными (DMP), свяжитесь с Координационным бюро по обмену океаническими данными (DCO-ODS), чтобы:
Step 3.1. Identify the type of data you’re collecting and the suitable repositories for it and discuss with DCO-ODS suitable repositories to submit your (meta)data to, and allow a connection with IOC’s data discovery systems:
Шаг 3.2. Определите свой Национальный центр океанографических данных (NODC) и/или ассоциированное подразделение по данным (ADU) и наладьте с ними связь, чтобы обеспечить долгосрочное хранение ваших данных и упростить подключение к глобальной цифровой экосистеме по океанографии.
Even if they cannot host the data themselves, they should be aware of it for coordination purposes with the DCO-ODS. Well-maintained metadata catalogues are essential in this effort.
If the NODC cannot store the data, contact DCO-ODS for discussion about suitable approaches.
Step 3.3. Describe the quality of your (meta)data:
✔️ Check that data is complete, well-labelled (be clear and concise when labelling variables or files, use standardised, open vocabularies where possible) – keep in mind your dataset could be reused by someone else. Where data are not complete, attempt to include explanations for why this is the case in associated metadata and in the DMP to help others understand.
✔️ Make sure your datasets are stored and released in widely known formats using open standards (such as CSV, with clear headers, NetCDF, JSON, and others described in the link). Avoid proprietary or customised formats that require specific software or uncommon expertise to access and use effectively
✔️ Note that many Repositories have their own data standardisation and formatting requirements. Ensure these are kept in mind and included in your DMP, to ensure that submission to these repositories is possible and does not require more effort than necessary.
✔️ Отдавайте приоритет использованию хорошо известных стандартов обмена данными, применяемых или определенных соответствующим сообществом, с целью максимального повторного использования набора данных; в случае неуверенности обращайтесь в DCO-ODS и/или Международной системе обмена океанографическими данными и информацией (IODE) для получения поддержки.
Шаг 3.4. Проверьте лицензии на ваши наборы данных
Лицензирование имеет важное значение при обмене данными, поскольку оно четко определяет, как данные могут быть использованы, обеспечивая юридическую ясность, надлежащее указание авторства и способствуя открытому, справедливому и ответственному повторному использованию. Владелец данных должен четко сформулировать и довести до сведения условия лицензии, чтобы хранилище и пользователи понимали свои права и обязанности:
- Уделять приоритетное внимание использованию открытых лицензий (CC, ODC, ODbLи т. д.) и сообщать о возможных ограничениях использования, а также о других желаемых разрешениях или ограничениях.
- If you work with Indigenous and local knowledge, ensure you have permission from the communities to share the data and give them correct acknowledgment using appropriate mechanisms.
- Если программа «Десятилетие действий» нуждается в помощи при выборе стандартной лицензии на данные для добавления к своим данным, обратитесь в Координационный офис «Десятилетия действий» по обмену океаническими данными.
4. Как хранить и архивировать данные об океане
Шаг 4. Работайте с DCO-ODS и репозиториями, чтобы обеспечить архивирование ваших данных.
Шаг 4.1. Подключитесь к глобальным системам, отправив свои данные в существующую инфраструктуру данных в сети IODE (национальные океанографические центры данных; ассоциированные подразделения по данным; узлы системы информации о биоразнообразии океана).
If vital (meta)data would be lost in harmonisation when submitting data to repositories, Decade Actions are also encouraged to deposit raw data in a generalist repository.
Step 4.2. Work with your data repository to assign Persistent Identifiers such as DOIs to your datasets. Here we use “Persistent Identifiers” to mean long-lasting references to objects on the internet, such as datasets. They may change the location they take users to so that the object the point to can be moved without the need for a new identifier, making them useful for applications such as citation of datasets in scientific papers or other reports.
This step will continue building up trust in your data so it can be reused and combined with other data to create new information, and be used in decision-making.
Что такое Стратегия в области данных и информации на десятилетие?
С ростом числа инициатив, направленных на сбор данных с помощью новых датчиков, автономных платформ и различных методов измерения и мониторинга океана, ситуация с данными становится все более сложной. Для решения этой проблемы необходимы общие стандарты, повышение совместимости и укрепление партнерских отношений — приоритеты, которые активно продвигает Десятилетие океанов.
Стратегия в области данных и информации для Десятилетия океана
To support the Ocean Decade’s work, the Data Coordination Group developed the Data and Information Strategy to encourage the exchange of interoperable, reliable, accessible, and timely ocean data and other digital resources. Its implementation represents a huge opportunity to transform the way ocean data and information are produced, shared, managed, and used globally and equitably.
Мы призываем сообщества и отдельных лиц, работающих над реализацией концепции цифровой океанической экосистемы в поддержку Десятилетия океанов, наладить и поддерживать конструктивное, открытое сотрудничество, преодолевая региональные, экономические, отраслевые, культурные, дисциплинарные и другие различия.
Видение стратегии в области данных и информации заключается в том, что к 2030 году мы будем иметь:
Надежную, инклюзивную и взаимосвязанную экосистему данных и информации об океане, которая активно используется для принятия решений в целях поддержки устойчивого управления океаном.
Миссия Стратегии по достижению заявленной цели к 2030 году заключается в следующем:
Чтобы стимулировать ориентированную на решение глобальную цифровую трансформацию цифровой экосистемы, нам необходимо преодолеть вызовы десятилетия.
Цели
Пять стратегических целей для реализации этой концепции и миссии Стратегии в области данных и информации:
Как план реализации согласуется с другой информацией?
План реализации Стратегии в области данных и информации является частью комплекса документов, опубликованных МОК и Десятилетием океанов, в которых изложены цели, стратегия, механизмы реализации и детали цифровой экосистемы для океана.
Нажмите здесь, чтобы увидеть список документов с данными об океане, подготовленных в рамках Десятилетия океана.
Ресурсы
Десятилетие океанов предлагает для своих действий и органов в рамках Десятилетия различные возможности для развития потенциала, такие как платформа Ocean Matcher.
Ocean Matcher — это инновационная веб-платформа, которая объединяет проекты в области океанологии, технологии и охраны окружающей среды с инвесторами.
Как найти дополнительную помощь?
Координационный офис Десятилетия по обмену океаническими данными (DCO-ODS) поддерживает действия Десятилетия в области управления данными и информацией и обмена ими, способствуя устойчивой цифровой совместимости данных, информации и цифровых знаний, полученных в результате инициатив, реализуемых в рамках Десятилетия.
Подход DCO-ODS заключается в следующем:
DCO-ODS предлагает различные инструменты для поддержки действий в рамках Десятилетия:
Вам нужна помощь в обмене данными, поиске данных или управлении данными? Ознакомьтесь с набором инструментов Ocean Decade Data Resources Toolkit!
Не можете найти ответ на свой вопрос? Обратитесь в службу поддержки по обмену данными в рамках Десятилетия океана, чтобы задать вопрос нашим экспертам по данным.
Лучшая практика: метод, который последовательно и доказательно превосходит другие методы с сопоставимыми целями по известным критериям. Заявления о том, что метод является лучшей практикой, должны быть проверены независимой третьей стороной, а все результаты тестирования и документация должны быть общедоступными.
Наращивание потенциала: процесс, в ходе которого создается или расширяется потенциал какой-либо организации (например, создание новых суперкомпьютерных центров для обеспечения большей вычислительной мощности).
Развитие потенциала: процесс, в ходе которого усиливается потенциал некоторой организации, что зачастую приводит к косвенному увеличению потенциала других организаций (например, оптимизация работы суперкомпьютерного центра при неизменной вычислительной мощности позволяет высвободить человеческие и электрические ресурсы для других целей).
Принципы CARE: коллективная выгода / полномочия по контролю / ответственность / этика: набор принципов в отношении данных, которые вместе с подпринципами содержат рекомендации о том, как данные и цифровые системы могут устранить противоречия, которые коренные сообщества ощущают между: 1) защитой прав и интересов коренных народов в отношении данных о коренных народах (включая традиционные знания) и 2) поддержкой открытых данных, машинного обучения, широкого обмена данными и инициатив в области больших данных.
Совместное проектирование: совместный процесс, в ходе которого лица, ответственные за проектирование объекта, привлекают к участию в процессе проектирования лиц, не являющихся проектировщиками (особенно конечных пользователей). Цель процесса совместного проектирования — уменьшить количество предположений о требованиях пользователей и обеспечить их реализацию на как можно более раннем этапе и в максимально полном объеме.
Данные: набор значений, символов или знаков (записанных на любом типе носителя), которые представляют одно или несколько свойств объекта или этот объект в целом. Например, числа, генерируемые датчиком, значения, полученные из модели или анализа, текст, введенный в опрос, символьные надписи на физических объектах или исходный текст документа. Примечание: этот термин включает в себя «метаданные», то есть данные о данных. Термин «данные о предмете» используется (в отличие от «метаданных») для обозначения данных об интересующем объекте, т. е. «предмете», о котором идут данные.
Хранилище данных: онлайн-платформа, используемая для размещения готовых наборов данных с целью их публикации, обмена и/или сохранения.Личные веб-сайты и базы данных, а также сервисы облачного хранения (Dropbox, Google Drive и т. д.) не считаются хранилищами. (Гентский университет, без даты)
Грамотность в области данных: способность людей эффективно находить, приобретать, анализировать, оценивать, понимать, создавать, (повторно) использовать и иным образом обрабатывать данные. Грамотность в области данных тесно связана с цифровой грамотностью, однако она касается способности человека работать с данными самостоятельно, а не с инструментами, которые их используют.
Цифровая экосистема: распределенная, адаптивная, открытая социально-техническая система, обладающая свойствами самоорганизации, самовоспроизводства и масштабируемости, аналогичными естественным экосистемам, и включающая: 1) взаимосвязанные технологические элементы, которые хранят, обрабатывают, обмениваются или иным образом обрабатывают данные, и 2) человеческие сообщества, которые их эксплуатируют и управляют ими. Всемирная паутина является примером цифровой экосистемы, как и частная сеть серверов. В зависимости от технической совместимости и управления их частями, цифровые экосистемы могут иметь разную степень фрагментации. По мере уменьшения фрагментации (например, за счет объединения данных) цифровые экосистемы могут превращаться в структуры данных, хранилища данных, пространства данных или аналогичные многосистемные архитектуры.
Принципы FAIR: Findability (находимость) / Accessibility (доступность) / Interoperability (совместимость) / Reusability (повторноиспользуемость): набор принципов, которые вместе с подпринципами дают рекомендации о том, как данные и цифровые системы могут работать более согласованно в сетевых системах.
Взаимодействие (данных): свойство объема данных, реализуемое при их корректной обработке с другими данными в нескольких независимых системах. Данные с высокой степенью взаимодействия представлены в форматах с семантической разметкой и другими атрибутами, которые позволяют независимым системам понимать и обрабатывать их с минимальным использованием ресурсов, вмешательством человека или преобразованием.
Открытые данные: данные, которые доступны, могут быть использованы, редактированы и (пере)распространяться любым лицом для любых целей и связаны с открытой лицензией.
Постоянный идентификатор: долговечная (обычно не менее десяти лет) ссылка на ресурс. Современные постоянные идентификаторы (PID) могут использоваться в Интернете, хранятся в виде URL-адресов или частей URL-адресов, но это не является обязательным требованием.
Качество: утверждение, направленное на некоторую сущность, которое выражает, насколько хороша или плоха эта сущность по отношению к некоторой рубрике или набору критериев.
Обеспечение качества: процесс, в ходе которого агент использует определенную шкалу или систему для оценки какого-либо объекта. Объекты, прошедшие процессы контроля качества, встроенные в процесс обеспечения качества, считаются пригодными для дальнейшей обработки или передачи другим агентам.
Контроль качества: процесс, в ходе которого оценивается соответствие объекта стандарту или идеальному состоянию. Этот процесс может также включать принятие или отклонение объектов на основании их соответствия или превышения критериев, выведенных из стандарта или идеального состояния.
Уникальный идентификатор: идентификатор, который с очень высокой вероятностью является уникальным.
Примеры существующих инструментов для управления данными (DMP), которые можно использовать для приведения вашего DMP в соответствие с требованиями Десятилетия океанов:
- Внедрение системы управления качеством данных в Морском институте, Ирландия
- NASA EarthData – Руководство по управлению данными для исследователей, финансируемых ESD
- DMP Tool – открытый инструмент, управляемый Калифорнийской цифровой библиотекой, подразделением Управления президента Калифорнийского университета.
- ДМП программы «Горизонт Европа» по долгосрочным наблюдениям за биоразнообразием морских и прибрежных экосистем (MARCO-BOLO)
- Руководство по плану управления данными – Руководства и пособия Межправительственной океанографической комиссии № 99
- IODE онлайн-курс по управлению данными, который можно проходить в удобном для себя темпе
- Руководство по управлению данными NOAA
- Набор инструментов для работы с данными
- Служба поддержки по обмену данными
- Глоссарий
-
Лучшая практика: метод, который последовательно и доказательно превосходит другие методы с сопоставимыми целями по известным критериям. Заявления о том, что метод является лучшей практикой, должны быть проверены независимой третьей стороной, а все результаты тестирования и документация должны быть общедоступными.
Наращивание потенциала: процесс, в ходе которого создается или расширяется потенциал какой-либо организации (например, создание новых суперкомпьютерных центров для обеспечения большей вычислительной мощности).
Развитие потенциала: процесс, в ходе которого усиливается потенциал некоторой организации, что зачастую приводит к косвенному увеличению потенциала других организаций (например, оптимизация работы суперкомпьютерного центра при неизменной вычислительной мощности позволяет высвободить человеческие и электрические ресурсы для других целей).
Принципы CARE: коллективная выгода / полномочия по контролю / ответственность / этика: набор принципов в отношении данных, которые вместе с подпринципами содержат рекомендации о том, как данные и цифровые системы могут устранить противоречия, которые коренные сообщества ощущают между: 1) защитой прав и интересов коренных народов в отношении данных о коренных народах (включая традиционные знания) и 2) поддержкой открытых данных, машинного обучения, широкого обмена данными и инициатив в области больших данных.
Совместное проектирование: совместный процесс, в ходе которого лица, ответственные за проектирование объекта, привлекают к участию в процессе проектирования лиц, не являющихся проектировщиками (особенно конечных пользователей). Цель процесса совместного проектирования — уменьшить количество предположений о требованиях пользователей и обеспечить их реализацию на как можно более раннем этапе и в максимально полном объеме.
Данные: набор значений, символов или знаков (записанных на любом типе носителя), которые представляют одно или несколько свойств объекта или этот объект в целом. Например, числа, генерируемые датчиком, значения, полученные из модели или анализа, текст, введенный в опрос, символьные надписи на физических объектах или исходный текст документа. Примечание: этот термин включает в себя «метаданные», то есть данные о данных. Термин «данные о предмете» используется (в отличие от «метаданных») для обозначения данных об интересующем объекте, т. е. «предмете», о котором идут данные.
Хранилище данных: онлайн-платформа, используемая для размещения готовых наборов данных с целью их публикации, обмена и/или сохранения.Личные веб-сайты и базы данных, а также сервисы облачного хранения (Dropbox, Google Drive и т. д.) не считаются хранилищами. (Гентский университет, без даты)
Грамотность в области данных: способность людей эффективно находить, приобретать, анализировать, оценивать, понимать, создавать, (повторно) использовать и иным образом обрабатывать данные. Грамотность в области данных тесно связана с цифровой грамотностью, однако она касается способности человека работать с данными самостоятельно, а не с инструментами, которые их используют.
Цифровая экосистема: распределенная, адаптивная, открытая социально-техническая система, обладающая свойствами самоорганизации, самовоспроизводства и масштабируемости, аналогичными естественным экосистемам, и включающая: 1) взаимосвязанные технологические элементы, которые хранят, обрабатывают, обмениваются или иным образом обрабатывают данные, и 2) человеческие сообщества, которые их эксплуатируют и управляют ими. Всемирная паутина является примером цифровой экосистемы, как и частная сеть серверов. В зависимости от технической совместимости и управления их частями, цифровые экосистемы могут иметь разную степень фрагментации. По мере уменьшения фрагментации (например, за счет объединения данных) цифровые экосистемы могут превращаться в структуры данных, хранилища данных, пространства данных или аналогичные многосистемные архитектуры.
Принципы FAIR: Findability (находимость) / Accessibility (доступность) / Interoperability (совместимость) / Reusability (повторноиспользуемость): набор принципов, которые вместе с подпринципами дают рекомендации о том, как данные и цифровые системы могут работать более согласованно в сетевых системах.
Взаимодействие (данных): свойство объема данных, реализуемое при их корректной обработке с другими данными в нескольких независимых системах. Данные с высокой степенью взаимодействия представлены в форматах с семантической разметкой и другими атрибутами, которые позволяют независимым системам понимать и обрабатывать их с минимальным использованием ресурсов, вмешательством человека или преобразованием.
Открытые данные: данные, которые доступны, могут быть использованы, редактированы и (пере)распространяться любым лицом для любых целей и связаны с открытой лицензией.
Постоянный идентификатор: долговечная (обычно не менее десяти лет) ссылка на ресурс. Современные постоянные идентификаторы (PID) могут использоваться в Интернете, хранятся в виде URL-адресов или частей URL-адресов, но это не является обязательным требованием.
Качество: утверждение, направленное на некоторую сущность, которое выражает, насколько хороша или плоха эта сущность по отношению к некоторой рубрике или набору критериев.
Обеспечение качества: процесс, в ходе которого агент использует определенную шкалу или систему для оценки какого-либо объекта. Объекты, прошедшие процессы контроля качества, встроенные в процесс обеспечения качества, считаются пригодными для дальнейшей обработки или передачи другим агентам.
Контроль качества: процесс, в ходе которого оценивается соответствие объекта стандарту или идеальному состоянию. Этот процесс может также включать принятие или отклонение объектов на основании их соответствия или превышения критериев, выведенных из стандарта или идеального состояния.
Уникальный идентификатор: идентификатор, который с очень высокой вероятностью является уникальным.
- Дополнительная литература
-
Примеры существующих инструментов для управления данными (DMP), которые можно использовать для приведения вашего DMP в соответствие с требованиями Десятилетия океанов:
- Внедрение системы управления качеством данных в Морском институте, Ирландия
- NASA EarthData – Руководство по управлению данными для исследователей, финансируемых ESD
- DMP Tool – открытый инструмент, управляемый Калифорнийской цифровой библиотекой, подразделением Управления президента Калифорнийского университета.
- ДМП программы «Горизонт Европа» по долгосрочным наблюдениям за биоразнообразием морских и прибрежных экосистем (MARCO-BOLO)
- Руководство по плану управления данными – Руководства и пособия Межправительственной океанографической комиссии № 99
- IODE онлайн-курс по управлению данными, который можно проходить в удобном для себя темпе
- Руководство по управлению данными NOAA









