Методология сравнительного статистического анализа промышленности России на основе кластерного анализа
https://doi.org/10.21686/2500-3925-2017-3-21-30
Аннотация
Статья посвящена изучению возможностей применения многомерного статистического анализа в исследовании промышленного производства России на основе сравнения его темпов роста и структуры с другими развитыми и развивающимися странами мира. Цель данной статьи заключается в определении оптимального набора статистических методов и последовательности их применения к данным промышленного производства, которые давали бы наилучший с точки зрения последующей содержательной интерпретации результат.
В качестве исследуемых данных выступают такие показатели структуры и динамики промышленного производства как индекс промышленного производства, выпуск, валовая добавленная стоимость, количество занятых и другие показатели системы национальных счетов и оперативной бизнес-статистики. Объектами наблюдения являются отрасли промышленного производства страны Евросоюза, Таможенного союза, США и Япония в 2005-2015 годах. В качестве инструмента исследования применены как простейшие приемы преобразований, графической и табличной визуализации данных, так и методы статистического анализа. В частности, на основе специализированного пакета программного обеспечения (СПСС) были применены метод главных компонент, дискриминантный анализ, иерархические методы кластерного анализа, метод Варда и к-средних.
Применение метода главных компонент к исходным данным позволяет существенно и эффективно сократить исходное пространство данных промышленного производства. Так, например, при анализе структуры промышленного производства сокращение составило с пятнадцати отраслей до трех основных, хорошо интерпретируемых, факторов: условно добывающие отрасли (с низкой степенью переработки), высокотехнологичные отрасли и отрасли товаров народного потребления (среднетехнологичные). При этом, в результате сравнения результатов применения кластерного анализа к исходным данным и данным, полученным на основе метода главных компонент, установлено что кластеризация данных промышленного производства на основе новых факторов значительно улучшает результаты кластеризации.
В результате анализа показателей разбиения данных на кластеры методами к-средних и иерархическими методами с использованием различных расстояний, было определено, что наилучший результат достигается при использовании комбинации данных методов, когда на первом этапе с помощью анализа визуализации иерархических алгоритмов (построения дендрограмм) определяется количество кластеров, на основе которого производится разбиение методом к-средних. При этом, значительное улучшение качества разбиения достигается за счет устранения в кластеризуемых данных выбросов, с последующим их включением в анализируемый набор с помощью дискриминантного анализа.
Применение данного подхода к данным структуры промышленного производства обеспечило высокие результаты. Полученные кластеры однородны по своему составу и содержательно интерпретируемы: в первый кластер входят страны с низкими показателями выпуска добывающей промышленности относительно совокупного выпуска экономики, при достаточно высоком значении данного показателя в других отраслях. В целом данную группу можно обозначить как страны с развитым промышленным производством высокотехнологичного типа. Вторая группа стран относительно других групп характеризуется в целом невысокой долей промышленности в экономике, и в частности более низкими показателями добывающих производств. К третьей группе стран относятся страны с высоко сырьевой базой, что характеризуется высокой долей в выпуске добывающих.
Об авторе
С. С. ШишулинРоссия
Аспирант кафедры «Статистика»
Список литературы
1. Социально-экономическое положение России (2016 год). Режим доступа: (Дата обращения: 05.05.2017)
2. Шишулин С.С. Сравнительный анализ темпов развития промышленного производства России и Евросоюза. Экономические науки. – 2015. – №8 (129)-2015 август – С. 99–103.
3. Шишулин С.С. Система экономико-статистических показателей структуры и динамики промышленного производства России. Мир новой экономики. – 2016 –Т. 10. №4. – С. 135–141
4. Statistical classification of economic activities in the European Community. NACERev. 2. Режим доступа: http://ec.europa.eu/competition/mergers/cases/index/nace_all.html (Дата обращения: 30.01.2017)
5. Общероссийский классификатор видов экономической деятельности (ОКВЭД2). Режим доступа:оквэд.рф/ (Дата обращения: 30.01.2017)
6. Айвазян С.А., Мхитарян В.С. Прикладная статистика. Основы эконометрики. – Т.1: Теория вероятностей и прикладная статистика М.: ЮНИТИ-ДАНА, 2001. – 656 с.
7. Берндт Э. Практика эконометрики. Классика и современность. М.: Юнити, 2005. – 863 с.
8. Greene W. Econometric Analysis. 7th Edition. – Prentice Hall, 2011. – 1231 p.
9. Hayashi, F. Econometrics. Princeton University Press, Princeton, 2000. – 683 p.
10. Вербик М. Путеводитель по современной эконометрике. М.: 2008. – 616 с.
Рецензия
Для цитирования:
Шишулин С.С. Методология сравнительного статистического анализа промышленности России на основе кластерного анализа. Статистика и Экономика. 2017;(3):21-30. https://doi.org/10.21686/2500-3925-2017-3-21-30
For citation:
Shishulin S.S. Methodology сomparative statistical analysis of Russian industry based on cluster analysis. Statistics and Economics. 2017;(3):21-30. (In Russ.) https://doi.org/10.21686/2500-3925-2017-3-21-30