Аннотация
статья посвящена вопросу рассмотрения данных, содержащихся в Едином государственном фонде данных (ЕГФД) Федеральной службы России по гидрометеорологии и мониторингу окружающей среды (Росгидромет), как больших данных (“Big Data”), а также описанию технологий и инструментов для работы с данными ЕГФД. В ЕГФД хранятся данные как на бумажных носителях, так в электронном виде, по гидрометеорологии и смежным с ней областям (метеорологии, аэрологии, гидрологии, океанологии и др.). Особый исследовательский интерес для аналитиков данных и специалистов по обработке данных могут представлять первичные данные в электронном виде. Электронные первичные данные распределены по слоям. В работе представлено обоснование классификации данных ЕГФД как больших данных, также описаны особенности хранящихся в ЕГФД данных. Кроме того, в качестве примера больших данных приведены данные специализированных массивов для климатических исследований, расположенные в открытом доступе, хранимые и пополняемые одним из учреждений Росгидромета — Федеральным государственным бюджетным учреждением «Всероссийский научно-исследовательский институт гидрометеорологической информации — Мировой центр данных» (ФГБУ «ВНИИГМИ-МЦД»). Приведен перечень предполагаемых для разработки технологий и инструментов для повышения эффективности работы с данными ЕГФД.
Литература
РД 52.19.143 –2019 Перечень документов архивного фонда данных о состоянии окружающей среды, ее загрязнении. Режим доступа: http://meteo.ru/egfd/145-metodical.
Постановление Правительства РФ от 21.12.1999 № 1410 «О создании и ведении Единого государственного фонда данных о состоянии окружающей природной среды, ее загрязнении». Режим доступа: https://www.meteorf.gov.ru/services/gosuslugi/29/doclist29/142/11985/.
Ведение ЕГФД, архивация данных, обслуживание данными и информацией ЕГФД. Сведения о составе Госфонда Росгидромета. Режим доступа: http://meteo.ru/egfd/142-about-egfd.
Кофтан Ю. Р., Перетятько Л. О. К построению технологии взаимной конвертации баз данных различной структуры для пополнения и верификации данных ЕГФД, а также для обслуживания потребителей. Труды ВНИИГМИ-МЦД. 2018;181:162–174.
Manyika J. et al. Big Data: The Next Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute; 2011.
Alba Diaz. The Four V’s of Big Data. Режим доступа: https://opensistemas.com/en/the-four-vs-of-big-data.
Niel Biehn. The Missing V’s in Big Data: Viability and Value. Режим доступа: https://www.wired.com/insights/2013/05/the-missing-vs-in-big-data-viability-and-value/.
Eileen McNulty. Understanding Big Data: the Seven V’s. Режим доступа: https://dataconomy.com/2014/05/seven-vs-big-data.
Булыгина О. Н., Коршунова Н. Н., Разуваев В. Н. Специализированные массивы данных для климатических исследований. Труды ВНИИГМИ-МЦД. 2014;177:136–148.
Специализированные массивы. Режим доступа: http://meteo.ru/data.
Перетятько Л. О., Кофтан Ю. Р. Система взаимной конвертации данных различной структуры для обслуживания потребителей ЕГФД. Труды ВНИИГМИ-МЦД. 2020;186:163–175.