ТАҢБАЛАРДЫ ОПТИКАЛЫҚ ТАНУ НӘТИЖЕЛЕРІНІҢ ДӘЛДІК ДЕҢГЕЙІН АРТТЫРУ ҮШІН МАШИНАЛЫҚ ОҚЫТУ ӘДІСТЕРІН ҚОЛДАНУ
https://doi.org/10.55452/1998-6688-2024-21-3-66-77
Аңдатпа
Қазіргі заманның ең кең таралған үрдістерінің бірі – адамзат өмірінің барлық негізгі салаларын қамтыған цифрландыру. Ақпараттық технологиялардың дамуы күнделікті өмірдің ғана емес, сондайақ кәсіпкерлік, экономика, денсаулық сақтау саласындағы күрделі бизнес-үрдістерді автоматтандыру арқылы жаһандық деңгейдегі өзгерістерге де ықпал етті. Цифрлық деректер мен құжаттамаға көшу қажетті ақпараттың қолжетімділігін қамтамасыз етіп қана қоймай, оны талдау мен өңдеудің тиімділігін арттырды. Осыған байланысты мәтіндік деректерді суреттерден анықтауға және алуға мүмкіндік беретін оптикалық таңбаларды тану (OCR) технологиялары маңызды. OCR технологиялары қоғамның цифрлық трансформациясында шешуші рөл атқарады, өйткені олар суреттердегі мәтіндік ақпаратпен қолмен жұмыс істеу қажеттілігін жояды және қағаз тасымалдағыштардағы деректерді өңдеуге қатысты көптеген бизнеспроцестерді автоматтандыруға мүмкіндік береді. Мысалы, қағаз нысандарынан статистикалық деректерді жинау, қағаз құжаттарын электрондық құжат айналымы жүйесіне енгізу, мәтіндік ақпаратты аудио файлдарға түрлендіру сияқты процестерде қолданылады. Бұл мақала оптикалық таңбаларды тану технологиясын сипаттауға және алынған нәтижелердің сапасын жақсарту мақсатында оны заманауи іске асыру аясында белсенді қолданылатын машиналық оқыту әдістеріне шолу жасауға арналған. Сонымен қатар мақалада сипатталған тәсілдердің жұмыс принциптері, олардың мүмкіндіктері, сондай-ақ белгілі бір сценарийлерде қолдану кезінде кездесетін кейбір шектеулер қарастырылған.
Авторлар туралы
В. А. ВыходцеваҚазақстан
магистрант
070000, Өскемен қ.
Г. В. Попова
Қазақстан
ф–м.ғ.к., қауымдастырылған профессор
070000, Өскемен қ.
Әдебиет тізімі
1. Singh A., Bacchuwar K., Bhasin A. A survey of OCR Applications. International Journal of Machine Learning and Computing, 2012, vol. 2, no. 3, pp. 314–318.
2. Shruthi P. Verma D. C. A Detailed study and recent research on OCR. International Journal of Computer Science and Information Security, 2021, vol. 19, no. 2, pp. 52–66.
3. Ahmed. M, Abidi A.I. Review on optical character recognition. International Research Journal of Engineering and Technology (IRJET), 2019, June, v0l. 06, issue 06, pp. 3666–3669.
4. Verma P., Foomani G. M. Improvement in OCR Technologies in Postal Industry Using CNN-RNN Architecture: Literature Review. International Journal of Machine Learning and Computing, 2022, vol. 12, no. 5, 154–163.
5. What is optical character recognition (OCR)? Ibm.com. January 5, 2022. https://www.ibm.com/blog/optical-character-recognition/
6. Modi H., Parikh M. C. A Review on Optical Character Recognition Techniques International Journal of Computer Applications, 2017, vol. 160, no. 6, pp. 20–24.
7. Fateh A., Fateh M., Abolghasemi V. Enhancing optical character recognition: Efficient techniques for document layout analysis and text line detection. Engineering Reports, 2023, November, pp. 1–26.
8. Wang X.F., He Z.H., Wang K., Wang Y.F., Zou L. A survey of text detection and recognition algorithms based on deep learning technology. Neurocomputing, 2023, November, vol. 556.
9. AI vs. Machine Learning vs. DeepLearning vs. Neural Networks: What’s the difference? Ibm.com. July 6, 2023. https://www.ibm.com/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networks/
10. Subedi B., Yunusov J., Gaybulayev A., Kim T. Development of a Low-cost Industrial OCR System with an End-to-end Deep Learning Technology. IEMEK J. Embed. Sys. Appl, 2020, April, pp. 51–60.
11. Difference Between Machine Learning and Deep Learning. GeeksForGeeks.org. June 5, 2023. https://www.geeksforgeeks.org/difference-between-machine-learning-and-deep-learning/
12. Meng F., Ghena B. Research on Text Recognition Methods Based on Artificial Intelligence and Machine Learning. Advances in Computer and Communications, 2023, November, pp. 340–344.
13. Memon J., Sami M., Khan R. A. Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR). IEEE Access, 2020, July, pp. 142642–142668.
14. Rakesh S., Reddy P.K., Prashanth V., Reddy K.S. Reddy. Handwritten text recognition using deep learning techniques: a survey. ICMED, 2024, pp. 1–8.
15. Nikolenko S., Kadurin A., Arkhangelskaya E. Glyubokoye obucheniye: Seriya «Biblioteka programmista» (SPb.: Izd-vo Piter, 2018), pp. 231–259 [in Russian].
16. Hemanth G.R., Jayasree M., Keerthi Venii S., Akshaya P., and R. Saranya. CNN-RNN based handwritten text recognition. ICTACT Journal on Soft Computing, 2021, October, vol. 12, pp. 2457–2463.
17. Ahlawat S., Choudhary A., Nayyar A., Singh S., Yoon B. Improved Handwritten Digit Recognition Using Convolutional Neural Networks (CNN). Sensors, 2020, June, pp. 1–18.
18. Goodfellow I, Bengio Y, Courville A. Deep Learning, (The MIT Press, 2015), pp. 297–329.
19. Shinde S., Saraiya T. Using CRNN to Perform OCR over Forms. International Journal of Engineering Research & Technology (IJERT), vol. 9, pp. 319–323.
20. Shi B., Bai X., & Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, pp. 2–3.
21. Clausner C., Antonacopoulos A., Pletschacher S. Efficient and effective OCR engine training. International Journal on Document Analysis and Recognition (IJDAR), 2019, October, vol. 23, pp. 73–88.
22. Mursari L.R., Wibowo A. The Effectiveness of Image Preprocessing on Digital Handwritten Scripts Recognition with The Implementation of OCR Tesseract. Computer Engineering and Applications, 2021, October, vol. 10, pp. 177–186.
23. Bagwe S., Shah V., Chauhan J., Harniya P., Tiwari A., Gupta V., Raikar D., Gada V., Bheda U., Mehta V., Warang M., Mehendale N. Optical character recognition using deep learning techniques for printed and handwritten documents. SSRN Electronic Journal, 2020, January, pp. 1–10.
24. Patel C., Patel A., Patel D. Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study. International Journal of Computer Applications, 2012, October, vol. 55, pp. 50–56.
25. Jain P., Dr. Taneja K., Dr. Taneja Harmunish. Which OCR toolset is good and why? A comparative study. Kuwait J.Sci., 2021, April, vol. 48 (2), pp. 1–12.
Рецензия
Дәйектеу үшін:
Выходцева В.А., Попова Г.В. ТАҢБАЛАРДЫ ОПТИКАЛЫҚ ТАНУ НӘТИЖЕЛЕРІНІҢ ДӘЛДІК ДЕҢГЕЙІН АРТТЫРУ ҮШІН МАШИНАЛЫҚ ОҚЫТУ ӘДІСТЕРІН ҚОЛДАНУ. Қазақстан-Британ техникалық университетінің хабаршысы. 2024;21(3):66-77. https://doi.org/10.55452/1998-6688-2024-21-3-66-77
For citation:
Vykhodtseva V.A., Popova G.V. APPLICATION OF MACHINE LEARNING TECHNIQUES TO INCREASE THE LEVEL OF ACCURACY OF OPTICAL CHARACTER RECOGNITION RESULTS. Herald of the Kazakh-British Technical University. 2024;21(3):66-77. https://doi.org/10.55452/1998-6688-2024-21-3-66-77