СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ДАННЫХ ПРИ ПРОГНОЗИРОВАНИИ ЦЕН TRADE-IN АВТО
https://doi.org/10.55452/1998-6688-2022-19-1-30-43
Аннотация
В статье реализованы и проанализированы алгоритмы машинного обучения для предсказания цен авто. Предсказание цен – одна из самых сложных, но интересных задач. В предсказании задействовано много факторов – год выпуска, состояние, пробег, объем двигателя и т.д. Эти аспекты в совокупности влияют на цены авто, делая их нестабильными и затрудняя прогнозирование с высокой степенью точности. Методы машинного обучения могут выявить закономерности и идеи, которые мы раньше не видели, и их можно использовать для безошибочно точных прогнозов и классификации данных. Выбор надлежащего алгоритма классификации данных, который подходил бы для отдельно взятой задачи, зависит от объема, качества и природы данных, от вычислительных ресурсов компьютера, а также от того, как вы планируете использовать результат. Каждый алгоритм классификации имеет свои особенности и основывается на определенных допущениях. В конечном счете качество классификатора, его вычислительная и предсказательная мощность зависят от базовых данных, предназначенных для тренировки алгоритма. Цель данной статьи – рассмотреть этапы предварительной обработки тренировочных данных и показать, как машинное обучение в частности и информационные технологии в целом преуспели в разработке инструментов для моделирования, проектирования, прогнозирования, планирования и поддержки принятия решений в области продажи авто. В данном исследовании предлагается гибридный подход к задачам прогнозирования, то есть к решению задач прогнозирования с применением методов статистического анализа и машинного обучения.
Об авторах
Еркежан Маратовна АсубаеваКазахстан
Магистрант
Зухра Муратовна Абдиахметова
Казахстан
PhD, и.о. доцента факультет информационных технологий
Список литературы
1. Narender Kumar, Dharmender K. Machine Learning based Heart Disease Diagnosis using Non-Invasive Methods, 2021, J. Phys.: Conf. Ser. 1950 012081.
2. Alarsan F.I., Younes M. Analysis and classification of heart diseases using heartbeat features and machine learning algorithms. J Big Data 6, 81, 2019. URL: https://doi.org/10.1186/s40537-019-0244-x.
3. Рашка С.Python и машинное обучение. – Москва: ДМК Пресс, 2017. – 265 с.
4. Akhmed-Zaki D.Zh., Mukhambetzhanov S.T., Nurmakhanova Zh.M. and Abdiakhmetova Z.M. Using Wavelet Transform and Machine Learning to Predict Heart Fibrillation Disease on ECG 2021 // IEEE International Conference on Smart Information Systems and Technologies (Nur-Sultan, 28-30 April, 2021). URL: https://doi.org/ 10.1109/SIST50301.2021.9465990.
5. Bilbro R., Ojeda T., Bengfort B.,Language-Aware Data Products with Machine Learning, O'Reilly Media, 2018, 313 p.
6. Жерон О. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow. – ДиалектикаВильямс, Альфа-книга, 2018. – 465 с.
7. Плас Дж.В. Python для сложных задач. Наука о данных и машинное обучение. – Питер, 2018. – 265 с.
8. Бослав С. Статистика для всех. – Москва: ДМК Пресс, 2015. – 201 с.
9. Бенгфорд Б., Билбро Р. Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка. – Санкт-Петербург, 2019. –181 с.
10. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение // Библиотека программиста. – Питер, 2019. – 304 с.
11. Chollet F. Deep learning with Python, Manning, 2020, 169 p.
12. Бурков А. Машинное обучение без лишних слов // Библиотека программиста. – Питер, 2020. – С. 60–69.
13. Shone N., Ngoc T.N., Phai V.D. and Shi Q. A deep learning approach tonetwork intrusion detection // IEEE Trans. Emerg. Topics Comput. Intell, vol. 2, no. 1, pp. 41–50.
14. Чистяков C.П. Случайные леса: обзор // Труды Карельского научного центра РАН.–2013.–No 1.– С.117–136.
15. Гришанов К.М., Белов Ю.С. Метод классификации K-NN и его применение в распознавании символов // Фундаментальные проблемы науки: Сборник статей Международной научно-практической конференции (15 мая 2016 г.) – Ч. 3. – Тюмень: НИЦ Аэтерна, 2016. – С. 30–33.
16. Jenhani I., Amor N. B., Eloued Z. Decision trees as possibilistic classifiers // International Journal of Approximate Reasoning, no. 48 (nov.2008), pp. 786–801. URL: https://doi.org/10.1016/j.ijar.2007.12.002.17 Rymarczyk T., Kozłowski E. Logistic Regression for Machine Learning in Process Tomography // MDPI, no. 19(15) (2019), pp. 206–208. URL: https://doi.org/10.3390/s19153400.
17. URL: https://haraba.ru.
18. Sanjay P. Pro RESTful APIs Design, Build and Integrate with REST, JSON, XML and JAX-RSApress, Berkeley, CA, 2018. URL: https://doi.org/10.1007/978-1-4842-2665-0.
19. Stephen R.G. Fraser Windows Services. In: Pro Visual C++/CLI and the .NET 2.0 Platform, Apress, 2006. URL: https://doi.org/10.1007/978-1-4302-0109-0_14.
Рецензия
Для цитирования:
Асубаева Е.М., Абдиахметова З.М. СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ДАННЫХ ПРИ ПРОГНОЗИРОВАНИИ ЦЕН TRADE-IN АВТО. Вестник Казахстанско-Британского технического университета. 2022;19(1):30-43. https://doi.org/10.55452/1998-6688-2022-19-1-30-43
For citation:
Assubayeva Ye.M., Abdiakhmetova Z.M. COMPARATIVE ANALYSIS OF DATA CLASSIFICATION METHODS FOR PREDICTION OF TRADE-IN AUTO PRICES. Herald of the Kazakh-British Technical University. 2022;19(1):30-43. https://doi.org/10.55452/1998-6688-2022-19-1-30-43