DNN ҚОЛДАНУ АРҚЫЛЫ ҚАЗАҚША СӨЙЛЕУІН АВТОМАТТЫ ТАНУ
Аңдатпа
Бұл жұмыста жасанды интеллекттің бір саласы сөйлеуді тану жүйесі сипатталған. Қазақ тілі мен басқа тілдердің зерттеулері салыстырылып, қазақ тілі сөйлеуін автоматты тануының мәселелері анықталған. Оның басты мәселесінің бірі зерттеу жұмыстарына арналған сөйлеу деректерінің болмауы, сондықтан қазақ сөйлеуінің акустикалық деректерін жинау жұмыстары баяндалды. Болашақта өзге де зерттеу жұмыстарын жүргізу мақсатында әрбір дикторға сәйкес жеке ақпараттарын сақтау форматы анықталды. Сөйлеу сигналдарын өңдеу, акустикалық және тілдік модельдерді оқытуға арналған алгоритмдер сипатталып, зерттеу және тәжірибелік жұмыстары жүргізілді. Терең нейрондық желі (DNN – Deep Neural Network) көмегімен сөйлеуді тану жүйесінің тесттік нәтижелері алынды. Олар дәстүрлі модельдердің нәтижелерімен салыстырылып, артықшылықтары ашып көрсетілді.
Авторлар туралы
О. МамырбаевҚазақстан
М. Тұрдалыұлы
Қазақстан
Н. Мекебаев
Қазақстан
Т. Тұрдалықызы
Қазақстан
А. Шаяхметова
Қазақстан
Әдебиет тізімі
1. Stouten F., Duchateau J., Martens J.-P., Wambacq P. Coping with disfluencies in spontaneous speech recognition: acoustic detection and linguistic context manipulation // Speech Communication. 2006. Vol. 48. pp. 1590-1606.
2. Tsiaras V., Panagiotakis C., Stylianou Y. Video and audio based detection of filled hesitation pauses in classroom lectures // Proc. o f the 17th European Signal Processing Conference (EUSIPCO 2009). Glasgow, Scotland, August 24-28, 2009. pp. 834-838.
3. Psutka J., Ircing P., Psutka J. V., Hajic J., Byrne W. J., Mirovsky J. Automatic Transcription of Czech, Russian, and Slovak Spontaneous Speech in the M ALACH Project // Proceedings of Eurospeech. Lisboa. Portugal. Sept. 4-8. 2005. pp. 1349-1352.
4. Young S. et al. The HTK Book (for HTK Version 3.4). Cambridge. UK, 2009. 375 p.
5. Karpov A., Kipyatkova I., Ronzhin A. Very Large Vocabulary A SR for Spoken Russian with Syntactic and Morphemic Analysis. In Proc. INTERSPEECH-2011, Florence, Italy, 2011, pp. 3161-3164.
6. Serizel, R., Giuliani, D.: Vocal tract length normalization approaches to DNN-Based children’s and adults’ speech recognition. IEEE W orkshop on Spoken Language Technology, pp. 135-140. 2014.
7. Behbahani, Yasser Mohseni, Babaali, Bagher, Turdalyuly Mussa Persian sentences to phoneme sequences conversion based on recurrent neural networks // Open Computer Science. - 2016. - Issue-6. - P. 219-225.
8. Dong Yu., Li Deng Automatic Speech Recognition // Shpringer. -2014. P. -315.
Рецензия
Дәйектеу үшін:
, , , , DNN ҚОЛДАНУ АРҚЫЛЫ ҚАЗАҚША СӨЙЛЕУІН АВТОМАТТЫ ТАНУ. Қазақстан-Британ техникалық университетінің хабаршысы. 2019;16(2):134-142.
For citation:
Mamyrbayev O., Turdalyuly M., Mekebayev N., Turdalykyzy T., Shayakhmetova A. AUTOMATIC KAZAKH SPEECH RECOGNITION WITH DNN. Herald of the Kazakh-British Technical University. 2019;16(2):134-142. (In Russ.)