Preview

Қазақстан-Британ техникалық университетінің хабаршысы

Кеңейтілген іздеу

ДИНАМИКАЛЫҚ ӨЗГЕРІСТЕГІ ОРТАДАҒЫ МУЛЬТИАГЕНТТІК ЖҮЙЕНІ КҮШЕЙТЕ ОҚЫТУ АЛГОРИТМДЕРІ НЕГІЗІНДЕ ЗЕРДЕЛЕУ

Толық мәтін:

Аңдатпа

Қазіргі таңда спорт сайыстарына ұтыс тігу заманауи қоғамның ең танымал ойын-сауық түрлерінің біріне айналды. Спорттық бәс тігулер кең етек жая түсумен бірге, сан алуан мәселелер де бетке шыға бастады. Зерттеу, бүгінгі күннің ең өзекті терминдердің бірін, мультиагенттік жүйелердің спорт сайыстарына ұтыс тігудегі қолданысын қарастырады. Нығайту алгоритмдері құмар ойындарды зерттеудегі таптырмас құрал болғандықтан, осы алгоритмнің жүзеге асуын және қолданысын анықтап көрсетеміз. Жазылған жұмыс мултиагенттік жүйелердің нығайту алгоритмінің арқасында спорт ойындарындағы ұтыскерлер мен ұтылғандарды анықтап, есептеу тәсілін көрсетеді. Сол үшін алгоритмнің тиімділігін шынайы ортада тексеріп, нәтижелерін шығарамыз. Сондай-ақ мультиагенттердің өздерінің арасында ақпаратты қаншалықты тиімді таситынын зерттейміз. Қорыта келе, алгоритмнің қолдану аялары мен болашақтағы мүмкіншіліктері туралы жан-жақты зерделенеді.

Авторлар туралы

А. Пренов
АО «КБТУ»
Қазақстан


А. Акшабаев
АО «КБТУ»
Қазақстан


Әдебиет тізімі

1. Huang, S. Introduction to Various Reinforcement Learning Algorithms. Part I (Q-Learning, SARSA, DQN, DDPG). (2018) Retrieved from https://towardsdatascience.com/introduction-to-various-reinforcement-learning-algorithms-i-q-learning-sarsa-dqn-ddpg-72a5e0cb6287

2. Choudhary, A. A Hands-On Introduction to Deep Q-Learning using OpenAI Gym in Python (2019). Retrieved from https://www.analyticsvidhya.com/blog/2019/04/introduction-deep-q-learning-python/

3. Violante, A. Simple Reinforcement Learning: Q-Learning. (2019). Retrieved from https://towardsdatascience.com/simple-reinforcement-learning-q-learning-fcddc4b6fe56

4. Garant, D., Castro, B., Lesser, V. Accelerating Multi-agent Reinforcement Learning with Dynamic Co-learning.(2014). Cambridge: Massachusetts Institute of Technology.

5. McCabe, A., Trevathan, J. Artificial Intelligence in Sports Prediction. (2008). Retrieved from https://www.researchgate.net/publication/220841301_Artificial_Intelligence_in_Sports_Prediction

6. Prenov, A. Code Sample. Retrieved from https://github.com/aibaq/


Рецензия

Дәйектеу үшін:


 ,   ДИНАМИКАЛЫҚ ӨЗГЕРІСТЕГІ ОРТАДАҒЫ МУЛЬТИАГЕНТТІК ЖҮЙЕНІ КҮШЕЙТЕ ОҚЫТУ АЛГОРИТМДЕРІ НЕГІЗІНДЕ ЗЕРДЕЛЕУ. Қазақстан-Британ техникалық университетінің хабаршысы. 2019;16(4):153-156.

For citation:


Prenov A., Akshabayev A. RESEARCH OF MULTIAGENT SYSTEM IN A DYNAMICALLY CHANGING ENVIRONMENT USING REINFORCEMENT LEARNING ALGORITHMS. Herald of the Kazakh-British Technical University. 2019;16(4):153-156.

Қараулар: 353


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)