ОПТИМИЗАЦИЯ АЛГОРИТМОВ ПОДГОТОВКИ ДАННЫХ ДЛЯ ОБУЧЕНИЯ И ПРИМЕНЕНИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ НА ЯЗЫКЕ PYTHON
Аннотация
В данной работе рассмотрена целесообразность применения различных алгоритмов подготовки данных для более качественного обучения модели на языке программирования python3. Рассмотрены способы взаимодействия с отсутствующими значениями в наборе данных и способы их устранения в зависимости от различных факторов. Рассмотрены алгоритмы преобразования номинальных переменных в вид, пригодный для обучения моделей библиотеки Scikit-Learn. Также рассмотрен способ комбинирования алгоритмов преобразования данных для достижения наивысшей предиктивной способности по F1 мере на примере модели бинарной классификации.
Об авторах
М. ДжиликбаевКазахстан
магистрант
А Акжалова
Казахстан
профессор
Список литературы
1. D. Powers, "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation,'' J. Mach. Learn. Res., 2, No.1, 37--63 (2011).
2. D. L. Olson and D. Delen, Advanced Data Mining Techniques, Springer, New York (2008).
3. S. E. Whang, "Goods: Organizing google’s datasets,'' SIGMOD, 795–-806 (2016).
4. L. Chen and A. Kumar, "Enabling and optimizing nonlinear feature interactions in factorized linear algebra,'' SIGMOD, 1571–-1588 (2019).
5. L. Chen, A. Kumar, J. F. Naughton and J. M. Patel, "Towards linear algebra over normalized data,'' PVLDB, 10, No.11, 1214–-1225 (2017).
6. I. Czogiel, K. Luebke and C. Weihs, "Response surface methodology for optimizing hyper parameters,'' Technical report, Universitat Dortmund Fachbereich Statistik (2005).
7. I. D. Erhan, Y. Bengio, A. Courville, P. Manzagol, P. Vincent and S. Bengio, ``Why does unsupervised pre-training help deep learning?'' Journal of Machine Learning Research, 625–-660 (2010).
8. G. E. Hinton, "A practical guide to training restricted Boltzmann machines,'' Technical Report, University of Toronto 1 (2010).
Рецензия
Для цитирования:
Джиликбаев М., Акжалова А. ОПТИМИЗАЦИЯ АЛГОРИТМОВ ПОДГОТОВКИ ДАННЫХ ДЛЯ ОБУЧЕНИЯ И ПРИМЕНЕНИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ НА ЯЗЫКЕ PYTHON. Вестник Казахстанско-Британского технического университета. 2020;17(3):131-136.
For citation:
Jilikbaev M., Akzhalova A. OPTIMIZATION OF DATA PREPARATION ALGORITHMS FOR TRAINING AND APPLICATION OF MACHINE LEARNING MODELS IN PYTHON. Herald of the Kazakh-British technical university. 2020;17(3):131-136. (In Russ.)