ВИКОРИСТАННЯ МАШИННОГО НАВЧАННЯ ДЛЯ КЛАСТЕРИЗАЦІЇ З ВИКОРИСТАННЯМ ІНДЕКСУ НЕБЕЗПЕКИ ХВОСТОСХОВИЩ ТА ЇХ ВПЛИВУ НА НАВКОЛИШНЄ СЕРЕДОВИЩЕ
DOI:
https://doi.org/10.32782/IT/2024-4-11Ключові слова:
машинне навчання, кластеризація, метод k-середніх, хвостосховища, метод DBSCAN, індекс небезпеки, метод агломеративної кластеризації, навколишнє середовище.Анотація
В статті виконано аналіз небезпечного впливу хвостосховищ утворених від промислового виробництва на навколишнє середовище методами машинного навчання з метою їх кластеризації. При різних розмірах хвостосховищ, їх токсичності та параметрів була визначена їх положення в кластерах, що дозволило класифікувати стан рівня їх небезпеки. Зроблено порівняльний аналіз підходів машинного навчання та інших методів пошуку аналогів для визначення потенційної небезпеки хвостосховищ. За допомогою методу DBSCAN було визначено хвостосховища, які за своїми параметрами потрапляли до кореневого, граничного та шумового кластерів. Всі хвостосховища, що потрапили до кореневого та граничного кластерів, було класифіковано наступним методом кластеризації – k-середніх, і вони були розподілені до одного з чотирьох кластерів. Кластеризація методом k-середніх будувалася на вибірках даних хвостосховищ шляхом порівняння метрики відстані між витягнутими в одновимірний вектор матрицями суміжності. Наведено результати оцінки роботи алгоритму, що підтверджують, що моделювання та пошук центрів кластеризації за допомогою k-середніх є більш комплексним рішенням задачі в порівнянні з методом агломеративної кластеризації, який було приведено до порівняння k-середніх. Таким чином точність використаного підходу кластеризації виявився вищою, ніж у існуючих класичних алгоритмах кластеризації. Метою роботи є кластеризація хвостосховищ, що утворені від діяльності промислового виробництва, за рівнем їх небезпечного впливу на навколишнє середовище з використанням методів машинного навчання. Методологія. Для досягнення мети використані методи машинного навчання та аналізу даних, що реалізуються в рамках фреймворку Sklearn мови програмування Python, використаний пакет роботи з даними pandas, що дозволяє обробляти великі масиви даних з використанням гнучкої системи форматування та запитів до них. Групування даних здійснювалося з використанням групи методів навчання без вчителя (unsupervised learning): алгоритмів кластеризації DBSCAN, кластерного аналізу методом ієрархічної деревоподібної кластеризації та методом k-середніх, методу головних компонентів. Наукова новизна. Наукова новизна полягає у виборі способів кластеризації хвостосховищ за допомогою методів кластерного аналізу. Висновки. За допомогою методів машинного навчання виконана кластеризація хвостосховищ, в залежності від ступеня їх небезпеки для навколишнього середовища.
Посилання
Nikolaieva I. O., Rudakov D. V. Development of a checklist for improvement of tailings safety. Naukovyi Visnyk Natsionalnoho Hirnychoho Universytetu. 2015. 2, 97–103
Proceedings of 7th International Conference Innovation Management, Entrepreneurship and Sustainability (IMES), 2019. Pp. 519–533
Kravchenko S., Hryshkun Ye. and Vlasenko O., Metody klasyfikatsii mashynnoho navchannia z vykorystanniam biblioteky scikit-learn, URL: http://tech.vernadskyjournals.in.ua/journals/2020/3_2020/part_1/21.pdf
Winkelmann-Oei G., Rudakov D., Shmatkov G., Nikolaieva I. A method for evaluation of tailings hazard. New Developments in Mining Engineering: Theoretical and Practical Solutions of Mineral Resources Mining / editors Bondarenko V., Kovalevska I., Pivnyak G. London: Taylor & Francis Group, 2015. pp. 33–38.
URL: https://www.sendaiplatform.org
Rico, M., Benito, G., Díez-Herrero, A. Floods from tailings dam failures. J. Hazard. Mater. 2008a. 154, 79–87.
Rico, M., Benito, G., Salgueiro, A.R., Díez -Herrero, A., Pereira, H.G. Reported tailings dam failures: a review of the European incidents in the worldwide context. J. Hazard. Mater. 2008b.152, 846–852.
Coduto D. P. Geotechnical Engineering: Principles and Practices. 1998.
Fredlund D. G., Rahardjo H., Fredlund M. D. Unsaturated Soil Mechanics in Engineering Practice. 2012.
Wozniak M. Editorial: Applying Machine Learning for Combating Fake News and Internet/Media Content Manipulation. 2021 URL: https://www.researchgate.net/publication/354462936_Editorial_Applying_Machine_Learning_for_Combating_Fake_News_and_InternetMedia_Content_Manipulation.
Astakhova N. N., Demidova L. A., Nikulchev E. V. Forecasting Method for Grouped Time Series with the Use of K-Means Algorithm. Applied Mathematical Sciences. 2015. Vol. 9. No. 97. P. 4813–4830.