Preview

Қазақстан-Британ техникалық университетінің хабаршысы

Кеңейтілген іздеу

ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ ӘКІМШІЛІК ҚҰҚЫҚ БҰЗУШЫЛЫҚ ТУРАЛЫ КОДЕКСІН ЛЕКСИКАЛЫҚ ЖӘНЕ ТАҚЫРЫПТЫҚ ТАЛДАУҒА АРНАЛҒАН ЕСЕПТЕУ КОНВЕЙЕРІ

https://doi.org/10.55452/1998-6688-2025-22-4-227-243

Толық мәтін:

Аңдатпа

Бұл зерттеу Қазақстан Республикасының Әкімшілік құқық бұзушылықтар туралы кодексі (ӘҚБтК, K1400000235) мәтінінің автоматтандырылған лингвистикалық және құрылымдық талдауына арналған есеп теуіш талдау жолын ұсынады. Ұсынылған жұмыс процесі деректерді жинау, мәтінді алдын ала өңдеу, токенизация, кілт сөздерді анықтау, семантикалық топтастыру және визуализацияны қамтиды. Бұл кезеңдер Python тіліндегі табиғи тілдерді өңдеу (NLP) және статистикалық әдістерді біріктіреді. Ұсынылған жүйе лексикалық, тақырыптық және сандық лингвистикалық талдауларды бірізді тізбекке біріктіріп, Кодекстің иерархиялық құрылымы (бөлімдер, тараулар және баптар) бойынша жиілік үлестірімдерін, семантикалық өрістер мен жасырын тақырыптарды анықтауға мүмкіндік береді. ӘҚБтК корпусын талдау бірнеше ерекше тілдік заңдылықтарды анықтады: санкциялар мен жауапкершілікке қатысты сөздердің (айыппұл, жауапкершілік, құқық бұзушылық) басым болуы, экономикалық және рәсімдік құқық бұзушылықтарға арналған тарауларда жоғары лексикалық тығыздықтың байқалуы, сондай-ақ әкімшілік құқықтың нормативтік-жазалаушылық сипатын бейнелейтін тақырыптық шоғырланулар. Жиілік гистограммалары, тақырыптық жылу карталары және тақырыптық карталар сияқты визуализация әдістері заң мәтіндерін сандық тұрғыдан зерттеудің әлеуетін көрсетеді. Жалпы алғанда, ұсынылған әдістеме салыстырмалы құқықтық лингвистика, заңнаманы автоматты түрде мониторингілеу және Қазақстандағы құқықтық аналитиканы жаңғырту үшін ауқымды негіз қалайды.

Авторлар туралы

Б. Мухсимбаев
Қазақстан-Британ техникалық университеті
Қазақстан

докторант

Алматы қ.



А. Пак
Қазақстан-Британ техникалық университеті
Қазақстан

PhD, профессор

Алматы қ.



А. Куралбаев
Қазақстан-Британ техникалық университеті
Қазақстан

докторант

Алматы қ.



Әдебиет тізімі

1. Theory and Methodology of the World’s National Linguistic Corpora. Linguistics Journal of Eurasia, 14(3), 33–45 (2022).

2. Tokatov, R.A., Akimzhanova, M.T. On the accuracy of the texts of the Civil Code of the Republic of Kazakhstan (General Part) in the Kazakh and Russian languages. Bulletin of L.N. Gumilyov Eurasian National University. Law Series, 3, 135–141 (2021). https://doi.org/10.31489/2021l3/135-141.

3. Ilyassova, G.A. Problems of ensuring authenticity of texts in Kazakh and Russian in the Civil Procedure Code of the Republic of Kazakhstan. Bulletin of L.N. Gumilyov Eurasian National University. Law Series, 3, 71–78 (2022). https://doi.org/10.31489/2022l3/71-78.

4. Ilyassova, G.A. Issues of application of terms in the state language in civil legislation (according to the text of the special part of the Civil Code of the Republic of Kazakhstan). Vestnik Akademii Upravleniya, 69(2), 123–134 (2023). https://doi.org/10.47649/vau.2023.v69.i2.14.

5. Zhanzhigitov, S.Zh. Linguistic strategies of legal communication in digital environments: The case of the PravMedia online forum. Bulletin of L.N. Gumilyov Eurasian National University. Philology Series, 3, 41–49 (2024). https://doi.org/10.31489/2024ph3/41-49.

6. Yeshpanov, R., Efimov, P., Boytsov, L., Shalkarbayuli, A., Braslavski, P. KazQAD: Kazakh opendomain question answering dataset. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC–COLING 2024). Torino, Italy: European Language Resources Association (ELRA), 2024, pp. 9645–9656.

7. Khairova, N., Kolesnyk, A., Mamyrbayev, O., Mukhsina, K. The Aligned Kazakh–Russian Parallel Corpus Focused on the Criminal Theme. Proceedings of the International Conference on Computational Linguistics and Intelligent Systems (COLINS), 2019, pp. 116–125.

8. Baisalov, A., Kenzhegulov, Y., Alimzhanova, Z. Instruction tuning on public government and cultural data for low-resource language: A case study in Kazakh. Proceedings of the 2024 Conference on Computational Linguistics for Low-Resource Languages, 2024 (Preprint available on arXiv).

9. Formation of the State Language as the Language of the Law. Bulletin of Law and State, 2, 56–68 (2022).

10. Kolesnik, A., Khairova, N. Use of linguistic criteria for estimating the quality of Wikipedia articles. Proceedings of the 1st International Conference on Computational Linguistics and Intelligent Systems (COLINS), 2017, pp. 207–215.

11. Khairova, N., Mamyrbayev, O., Rizun, N., Razno, M., Ybytayeva, G. A parallel corpus-based approach to crime event extraction for low-resource languages. IEEE Access, 11, 54093–54111 (2023).

12. Yeshpanov, R., Varol, H.A. KazSAnDRA: Kazakh sentiment analysis dataset of reviews and attitudes. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC–COLING 2024), Torino, Italy: European Language Resources Association (ELRA), 2024.

13. Karipova, A., Serikbekova, S., Aralbekov, G., Tuleugaliyeva, Zh., Sarsenova, A. Comparative analysis of administrative liability for driving while intoxicated in the Commonwealth of Independent States. Hrvatska i komparativna javna uprava. Croatian and Comparative Public Administration, 24(4), 889–910 (2024).

14. Drápal, J., Westermann, H., Savelka, J. Using large language models to support thematic analysis in empirical legal studies. Proceedings of the Thirty-sixth Annual Conference on Legal Knowledge and Information Systems (JURIX 2023). Maastricht, The Netherlands: IOS Press, 2023, pp. 65–74.

15. Malik, V., Sanjay, R., Guha, S.K., Hazarika, A., Nigam, S.K., Bhattacharya A., Modi A. Semantic segmentation of legal documents via rhetorical roles. Proceedings of the Natural Legal Language Processing Workshop (NLLP 2022). Abu Dhabi, United Arab Emirates (Hybrid): Association for Computational Linguistics, 2022, pp. 132–142.

16. Niekler, A., Wiedemann, G., Heyer, G. Leipzig Corpus Miner: A text mining infrastructure for qualitative data analysis. Proceedings of the Terminology and Knowledge Engineering Conference (TKE 2014). Berlin, Germany, 2014, pp. 441–450.


Рецензия

Дәйектеу үшін:


Мухсимбаев Б., Пак А., Куралбаев А. ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ ӘКІМШІЛІК ҚҰҚЫҚ БҰЗУШЫЛЫҚ ТУРАЛЫ КОДЕКСІН ЛЕКСИКАЛЫҚ ЖӘНЕ ТАҚЫРЫПТЫҚ ТАЛДАУҒА АРНАЛҒАН ЕСЕПТЕУ КОНВЕЙЕРІ. Қазақстан-Британ техникалық университетінің хабаршысы. 2025;22(4):227-243. https://doi.org/10.55452/1998-6688-2025-22-4-227-243

For citation:


Mukhsimbayev B., Pak A., Kuralbayev A. A COMPUTATIONAL PIPELINE FOR LEXICAL AND THEMATIC ANALYSIS OF THE CODE OF ADMINISTRATIVE OFFENSES OF THE REPUBLIC OF KAZAKHSTAN. Herald of the Kazakh-British Technical University. 2025;22(4):227-243. https://doi.org/10.55452/1998-6688-2025-22-4-227-243

Қараулар: 78

JATS XML


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)