Preview

Статистика и Экономика

Расширенный поиск

Методы интеллектуальной обработки данных для исследования влияния окружающей среды на заболеваемость населения в Москве

https://doi.org/10.21686/2500-3925-2024-2-72-82

Аннотация

Цель исследования. Цель исследования состоит в том, чтобы подтвердить или опровергнуть экологическую детерминированность возникновения социально значимых заболеваний у населения Москве на основе анализа данных по экологическим и здравоохранительным показателям в разрезе муниципальных единиц города.
Материалы и методы. В статье проведен анализ российской и зарубежной библиографии по проблеме исследования. На основе собранных и обработанных открытых данных по экологическим показателям и по заболеваемости населения в различных районах Москвы были проведены различные виды анализа для выявления взаимосвязи между этими данными. Для классификации социально значимых заболеваний на основе экологических показателей места проживания были построены модели машинного обучения. Математическую основу методов машинного обучения составляют метод k-ближайших соседей, многослойный перцептрон, градиентный бустинг. Для построения моделей использован программный инструмент Jupyter Notebook, поддерживающий язык программирования Python.
Результаты. Корреляционно-регрессионный анализ показал, что между некоторыми выбранными экологическими показателями и возникновением социально значимых заболеваний существует статистически значимая корреляция. Данный результат говорит о возможной взаимосвязи, что является одним из главных выводов данной работы. Разработан веб-интерфейс для автоматизации анализа новых данных с помощью построенных моделей машинного обучения, использованных при проведении регрессионного анализа для построения бинарной логистической модели (предсказание на основе собранных данных людей с социально значимыми заболеваниями) и модели мультиклассовой классификации (предсказание на основе собранных данных, какая именно болезнь может быть выявлена у человека). Проведен анализ используемых моделей машинного обучения, определена наилучшая модель для классификации социально значимых заболеваний.
Заключение. В результате проведенного исследования удалось собрать полноценную информацию о различных экологических показателях и наличии или отсутствии различных объектов, оказывающих воздействие на окружающую среду. Эти данные были использованы не только в моделях машинного обучения, но и для формирования объективной оценки экологической обстановки муниципальных единиц города Москвы. Поскольку было реализовано автоматическое обновление рейтинга для динамических данных данный результат может быть использован обычными пользователями, не имеющих достаточных квалификаций в экологии и медицине для самостоятельного анализа экологического состояния районов. Считаем, что такие исследования наверняка приведут к эффективным практическим решениям в данной области.

Об авторах

Т. В. Золотова
Финансовый университет при Правительстве РФ
Россия

Татьяна Валерьяновна Золотова

Москва



А. С. Марунько
Финансовый университет при Правительстве РФ
Россия

Анна Сергеевна Марунько

Москва



Список литературы

1. Гальперин М. В. Общая экология. М.: ИНФРА-М, 2022. 336 с.

2. Гичев Ю. П. Экологическая детерминированность основных заболеваний и сокращения продолжительности жизни. Новосибирск: София, 2021. 130 с.

3. Ефанов А.М., Ляхова О.Л., Мезенцева О.А. Влияние шумового воздействия на здоровье человека // Наука-2020. 2019. № 11. С. 158–162.

4. Лукашевич О.А., Хамдиев И.Ю., Васильев М.В Негативное экологическое влияние аэропортов на окружающую местность // Новые импульсы развития: вопросы научных исследований. 2020. № 7. С. 16–20.

5. Brusseau M.L., Pepper I.L., Gerba C.P., Brusseau M.L. Environmental and Pollution Science. Burlington: Elsevier Inc, 2019. 532 с.

6. Humphries G.R.W., Magness D.R., Huettmann F. Machine Learning for Ecology and Sustainable Natural Resource Management. Cham: Springer Nature Switzerland, 2018. 441 с.

7. Тюрина Т.А. Эволюция взглядов на мир в контексте проблем экологии // Гуманитарные и социальные науки. 2016. № 4. С. 36–40.

8. Семенова Н.П., Ушкарева О.А. Влияние загрязнения атмосферного воздуха на заболеваемость населения Республики Саха (Якутия) // Здоровье населения и среда обитания. 2013. № 10. С. 34–37.

9. Едаменко А.С. Проблемы урбанизированных российских территорий // Концепт. 2018. № 4. С. 1–4.

10. Мун С.А., Зинчук С.Ф. Оценка экологической опасности территорий и онкологической заболеваемости населения Кемеровской области в зависимости от загрязнения атмосферного воздуха // Современные проблемы науки и образования. 2015. № 6. С. 1–11.

11. Мамырбаев А.А. Медико-экологическая оценка здоровья населения в регионах добычи углеводородного сырья. Актобе: НАО ЗКГМУ им. М. Оспанова, 2019. 126 с.

12. Гасангаджиева А.Г., Габибова П.И., Даудова М.Г., Галкина И.В., Гираев К.М., Магомедова З.Я. Медико-экологическая оценка и прогноз социально значимой патологии населения Республики Дагестан // Юг России: экология, развитие. 2019. № 4. С. 147–164.

13. Chawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. SMOTE: Synthetic Minority Over-sampling Technique // Journal Of Artificial Intelligence Research. 2002. № 16. С. 321–357.

14. Grandini M., Bagli E., Visani G. Metrics for Multi-Class Classification: an Overview [Электрон. ресурс]. Режим доступа: https://arxiv.org/abs/2008.05756. (Дата обращения: 12.04.2023).

15. Bataresh F.A., Yang R. Data Democracy: At the Nexus of Artificial Intelligence, Software Development, and Knowledge Engineering. London: Academic Press, 2020. 266 с.

16. Лохов А.С., Коробов В.Б. Сравнительный анализ применения весовых коэффициентов и коэффициентов значимости в классификационных геоэкологических моделях // Проблемы региональной экологии. 2022. № 4. С. 81–86.

17. Волокобинский М.Ю., Пекарская О.А., Рази Д.А. Принятие решений на основе метода анализа иерархий // Вестник Финансового университета. 2016. № 2. С. 33–42.

18. Dos Santos P.H., Neves S.M., Sant’Anna D.O., Oliveira C.H., Carvalho H.D. The analytic hierarchy process supporting decision making for sustainable development: An overview of applications // Journal of Cleaner Production. 2019. № 7. С. 119–138.

19. Документация API Портала открытых данных города Москвы [Электрон. ресурс]. Режим доступа: https://apidata.mos.ru/Docs. (Дата обращения: 20.04.2023).

20. Документация Streamlit [Электрон. ресурс]. Режим доступа: https://docs.streamlit.io/. (Дата обращения: 24.04.2023).


Рецензия

Для цитирования:


Золотова Т.В., Марунько А.С. Методы интеллектуальной обработки данных для исследования влияния окружающей среды на заболеваемость населения в Москве. Статистика и Экономика. 2024;21(2):72-82. https://doi.org/10.21686/2500-3925-2024-2-72-82

For citation:


Zolotova T.V., Marunko A.S. Intelligent Data Processing Methods for Studying the Influence of the Environment on the Morbidity of the Population in Moscow. Statistics and Economics. 2024;21(2):72-82. (In Russ.) https://doi.org/10.21686/2500-3925-2024-2-72-82

Просмотров: 199


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2500-3925 (Print)