Использование информационной инфраструктуры цифровой экономики для повышения качества статистических данных
https://doi.org/10.21686/2500-3925-2018-4-77-86
Аннотация
Официальная статистика является основным поставщиком данных об экономическом состоянии макроэкономического уровня, на основе статистических данных принимается большинство экономических решений государственного масштаба. Работа с данными для органов статистики является ключевым бизнес-процессом. Вместе с тем уровень качества статистических данных, поставляемых Росстатом, не всегда оказывается достаточно высоким. Наблюдаются корректировки статистических данных, выявляются несоответствие между наборами данных, описывающих одно и то же экономическое явление.
Целью работы является описание методов сбора и обработки статистической информации, которые будут способствовать повышению качества поставляемых данных. С информационной точки зрения статистическое агентство занимаются организацией информационного обмена между поставщиками данных и потребителями, выступает агрегатором данных. Для организации информационного обмена в рамках сообщества пользователей создается семантическое пространство, призванное обеспечить смысловое наполнение данных. Основную роль в создании семантического пространства играют идентификаторы объектов учета. В качестве методов сбора и обработки статистической информации и повышения ее качества в статье рассматриваются использование единых идентификаторов отдельных объектов статистического учета. В международной статистической практике применяются методы стандартизации оборота статистических данных. Информационные стандарты призваны унифицировать идентификаторы и пространство имен для участников оборота статистической информации, что позволяет обеспечить единое семантическое пространство. С применением единых идентификаторов становятся прозрачными процедуры обработки статистических данных, в том числе группировка по разным срезам, а также разложение агрегированных данных на составляющие.
Результатами работы являются рекомендации по использованию отдельных элементов информационной инфраструктуры для сбора и анализа статистических данных. В существующей информационной инфраструктуре цифровой экономики существует ряд источников данных, использование которых будет способствовать повышению качества сбора и обработки статистических данных. Для создания семантического пространства статистических данных в РФ наиболее актуальным разделом являются реестры базовых объектов. Использование реестров позволит организовать связывание статистических данных из разных предметных областей, а также реализовывать соединение агрегированных данных с микроданными. Существенный прогресс наблюдается в маркировке товаров, которая позволяет отслеживать движение по всем этапам жизненного цикла, а также местоположение объекта. Правительство РФ инициировало проект по маркировке товаров, и эта информация дает возможность получить полное представление о существенной части экономики. Дополнительным информационным источником статистических данных может выступать корпоративный сектор, активно использующий в своей деятельности системы прослеживания, которые выполняют мониторинг товара, транспортных средств, контейнеров, складского хозяйства.
Заключение: Существует несколько вариантов обеспечения семантического единообразия статистических данных. Мировой опыт ориентируется на использование веб архитектуры, предполагающей использование технологических идентификаторов. Семантику статистических данных возможно обеспечить путем использования созданного потенциала информационной инфраструктуры, что позволит решить ряд проблем статистического учета.
Об авторе
Ю. П. ЛипунцовРоссия
Юрий Павлович Липунцов - к.э.н., доцент, доцент Кафедры экономической информатики
Список литературы
1. Салихов М. В заложниках у статистической погрешности: почему сложно верить Росстату 27.06.2018. URL: https://www.rbc.ru/opinions/economics/27/06/2018/5b3201229a794725025a6958. (Дата обращения: 07.07.2018).
2. ТАСС. «МЭР: Росстат должен повысить качество статистики и уровень доверия к ней» 04.04.2017. URL: http://tass.ru/ekonomika/4153390. (Дата обращения: 18.05.2018).
3. UNSD. «Official Statistics: Principles and Practices» 18.02.2017. URL: https://unstats.un.org/unsd/methods/statorg/FP-Russian.pdf. (Дата обращения: 19.04.2018).
4. M. Pellegrino. «Maintaining the quality of EU statistics while enabling re-use» в SEMIC, Dublin, 2013.
5. Statistical Working Group. «Statistical Data and Metadata Exchange» URL: http://sdmx.org/. (Дата обращения: 23 3 2015).
6. ISO/TC 154 , «ISO/TS 17369:2005 Statistical data and metadata exchange (SDMX)» 10 10 2005. URL: https://www.iso.org/standard/40555.html. (Дата обращения: 16 05 2018).
7. M. Hausenblas, W. Halb, Y. Raimond, L. Feigenbaum, D. Ayers « SCOVO: Using Statistics on the Web of Data» в Proceedings of ESWC 2009 — 6th European Semantic Web Conference, Heraklion, 2009.
8. M. Hausenblas, W. Halb и Y. Raimond, «Scripting User Contributed Interlinking» в 4th Workshop on Scripting for the Semantic Web (SFSW08). Tenerife, 2008.
9. K. Alexander, R. Cyganiak, M. Hausenblas и J. Zhao, «Describing Linked Datasets» в Proceedings of the Linked Data on the Web Workshop (LDOW2009), Madrid, 2009.
10. W. Arms, Digital Libraries. Retrieved 04.04.2017. Boston: M.I.T. Press., 2000 .
11. N. Paskin Naming and meaning of Digital Objects // Proceedings of the 2nd International Conference on Automated Production of Cross Media, 2006.
12. Y. Lipuntsov, R. Beatch, I. Collier. Financial Markets Data Collection Using the Information Model of Interagency Cooperation and the International System of Codification of Financial Instruments // Communications in Computer and Information Science. 2017. т. 745.
13. Y. Lipuntsov. An Information model of Interagency Communication Based on Distributed Data Storage» в International Conference on Electronic Governance and Open Society: Challenges in Eurasia (EGOSE ‘16), New York, 2016.
14. РБК. Назван единый оператор по электронной маркировке товаров» 12.07.2018. URL: https://www.rbc.ru/rbcfreenews/5b45ee149a79474230d4c946?from=newsfeed. (Дата обращения: 08.08.2018).
15. GS1. «GS1 General Specifications» URL: https://www.gs1.org/docs/barcodes/GS1_General_Specifications.pdf.
16. R. Cyganiak, M. Hausenblas, E. McCuirc. Official Statistics and the Practice of Data Fidelity. New York: Linking Government Data, 2011.
17. Росстат. «О некоторых дополнительных мерах по реализации государственной политики в сфере государственной статистической деятельности в связи с вступлением Российской Федерации в ОЭСР» 2017. URL: www.gks.ru/free_doc/new_site/rosstat/os/docl2_5.doc. (Дата обращения: 03.05.2018).
18. UK Cabinet Office «e-Government Metadata Standard» 28.08.2006. URL: www.nationalarchives.gov.uk/documents/information-management/egmsmetadata-standard.pdf.
19. EuroStat. Кодекс норм европейской статистики URL: http://ec.europa.eu/eurostat/quality.
20. R. Cyganiak, S. Field, A. Gregory и J. Tennison. Semantic Statistics: Bringing Together SDMX and SCOVO» в Richard Cyganiak Simon Field Simon Field Arofan Gregory Jeni Tennison, Semantic SProceedings of the WWW2010 Workshop on Linked Data on the Web, LDOW 2010, Raleigh, 2010.
Рецензия
Для цитирования:
Липунцов Ю.П. Использование информационной инфраструктуры цифровой экономики для повышения качества статистических данных. Статистика и Экономика. 2018;15(4):77-86. https://doi.org/10.21686/2500-3925-2018-4-77-86
For citation:
Lipuntsov Yu.P. Usage of the digital economy information infrastructure to improve the quality of statistical data. Statistics and Economics. 2018;15(4):77-86. (In Russ.) https://doi.org/10.21686/2500-3925-2018-4-77-86