Preview

Вестник Казахстанско-Британского технического университета

Расширенный поиск

ОПТИМИЗАЦИЯ АЛГОРИТМОВ ПОДГОТОВКИ ДАННЫХ ДЛЯ ОБУЧЕНИЯ И ПРИМЕНЕНИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ НА ЯЗЫКЕ PYTHON

Аннотация

В данной работе рассмотрена целесообразность применения различных алгоритмов подготовки данных для более качественного обучения модели на языке программирования python3. Рассмотрены способы взаимодействия с отсутствующими значениями в наборе данных и способы их устранения в зависимости от различных факторов. Рассмотрены алгоритмы преобразования номинальных переменных в вид, пригодный для обучения моделей библиотеки Scikit-Learn. Также рассмотрен способ комбинирования алгоритмов преобразования данных для достижения наивысшей предиктивной способности по F1 мере на примере модели бинарной классификации.

Об авторах

М. Джиликбаев
Казахстанско-Британский технический университет
Казахстан

магистрант



А Акжалова
Казахстанско-Британский технический университет
Казахстан

профессор



Список литературы

1. D. Powers, "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation,'' J. Mach. Learn. Res., 2, No.1, 37--63 (2011).

2. D. L. Olson and D. Delen, Advanced Data Mining Techniques, Springer, New York (2008).

3. S. E. Whang, "Goods: Organizing google’s datasets,'' SIGMOD, 795–-806 (2016).

4. L. Chen and A. Kumar, "Enabling and optimizing nonlinear feature interactions in factorized linear algebra,'' SIGMOD, 1571–-1588 (2019).

5. L. Chen, A. Kumar, J. F. Naughton and J. M. Patel, "Towards linear algebra over normalized data,'' PVLDB, 10, No.11, 1214–-1225 (2017).

6. I. Czogiel, K. Luebke and C. Weihs, "Response surface methodology for optimizing hyper parameters,'' Technical report, Universitat Dortmund Fachbereich Statistik (2005).

7. I. D. Erhan, Y. Bengio, A. Courville, P. Manzagol, P. Vincent and S. Bengio, ``Why does unsupervised pre-training help deep learning?'' Journal of Machine Learning Research, 625–-660 (2010).

8. G. E. Hinton, "A practical guide to training restricted Boltzmann machines,'' Technical Report, University of Toronto 1 (2010).


Рецензия

Для цитирования:


Джиликбаев М., Акжалова А. ОПТИМИЗАЦИЯ АЛГОРИТМОВ ПОДГОТОВКИ ДАННЫХ ДЛЯ ОБУЧЕНИЯ И ПРИМЕНЕНИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ НА ЯЗЫКЕ PYTHON. Вестник Казахстанско-Британского технического университета. 2020;17(3):131-136.

For citation:


Jilikbaev M., Akzhalova A. OPTIMIZATION OF DATA PREPARATION ALGORITHMS FOR TRAINING AND APPLICATION OF MACHINE LEARNING MODELS IN PYTHON. Herald of the Kazakh-British technical university. 2020;17(3):131-136. (In Russ.)

Просмотров: 312


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)