Preview

Қазақстан-Британ техникалық университетінің хабаршысы

Кеңейтілген іздеу

DNN ҚОЛДАНУ АРҚЫЛЫ ҚАЗАҚША СӨЙЛЕУІН АВТОМАТТЫ ТАНУ

Толық мәтін:

Аңдатпа

Бұл жұмыста жасанды интеллекттің бір саласы сөйлеуді тану жүйесі сипатталған. Қазақ тілі мен басқа тілдердің зерттеулері салыстырылып, қазақ тілі сөйлеуін автоматты тануының мәселелері анықталған. Оның басты мәселесінің бірі зерттеу жұмыстарына арналған сөйлеу деректерінің болмауы, сондықтан қазақ сөйлеуінің акустикалық деректерін жинау жұмыстары баяндалды. Болашақта өзге де зерттеу жұмыстарын жүргізу мақсатында әрбір дикторға сәйкес жеке ақпараттарын сақтау форматы анықталды. Сөйлеу сигналдарын өңдеу, акустикалық және тілдік модельдерді оқытуға арналған алгоритмдер сипатталып, зерттеу және тәжірибелік жұмыстары жүргізілді. Терең нейрондық желі (DNN – Deep Neural Network) көмегімен сөйлеуді тану жүйесінің тесттік нәтижелері алынды. Олар дәстүрлі модельдердің нәтижелерімен салыстырылып, артықшылықтары ашып көрсетілді.

Авторлар туралы

О. Мамырбаев
Институт информационных и вычислительных технологий КН МОН РК
Қазақстан


М. Тұрдалыұлы
Институт информационных и вычислительных технологий КН МОН РК
Қазақстан


Н. Мекебаев
Институт информационных и вычислительных технологий КН МОН РК; Казахский Национальный университет им. аль-Фараби
Қазақстан


Т. Тұрдалықызы
Институт информационных и вычислительных технологий КН МОН РК
Қазақстан


А. Шаяхметова
Институт информационных и вычислительных технологий КН МОН РК
Қазақстан


Әдебиет тізімі

1. Stouten F., Duchateau J., Martens J.-P., Wambacq P. Coping with disfluencies in spontaneous speech recognition: acoustic detection and linguistic context manipulation // Speech Communication. 2006. Vol. 48. pp. 1590-1606.

2. Tsiaras V., Panagiotakis C., Stylianou Y. Video and audio based detection of filled hesitation paus­es in classroom lectures // Proc. o f the 17th European Signal Processing Conference (EUSIPCO 2009). Glasgow, Scotland, August 24-28, 2009. pp. 834-838.

3. Psutka J., Ircing P., Psutka J. V., Hajic J., Byrne W. J., Mirovsky J. Automatic Transcription of Czech, Russian, and Slovak Spontaneous Speech in the M ALACH Project // Proceedings of Eurospeech. Lisboa. Portugal. Sept. 4-8. 2005. pp. 1349-1352.

4. Young S. et al. The HTK Book (for HTK Version 3.4). Cambridge. UK, 2009. 375 p.

5. Karpov A., Kipyatkova I., Ronzhin A. Very Large Vocabulary A SR for Spoken Russian with Syntactic and Morphemic Analysis. In Proc. INTERSPEECH-2011, Florence, Italy, 2011, pp. 3161-3164.

6. Serizel, R., Giuliani, D.: Vocal tract length normalization approaches to DNN-Based children’s and adults’ speech recognition. IEEE W orkshop on Spoken Language Technology, pp. 135-140. 2014.

7. Behbahani, Yasser Mohseni, Babaali, Bagher, Turdalyuly Mussa Persian sentences to phoneme sequences conversion based on recurrent neural networks // Open Computer Science. - 2016. - Issue-6. - P. 219-225.

8. Dong Yu., Li Deng Automatic Speech Recognition // Shpringer. -2014. P. -315.


Рецензия

Дәйектеу үшін:


 ,  ,  ,  ,   DNN ҚОЛДАНУ АРҚЫЛЫ ҚАЗАҚША СӨЙЛЕУІН АВТОМАТТЫ ТАНУ. Қазақстан-Британ техникалық университетінің хабаршысы. 2019;16(2):134-142.

For citation:


Mamyrbayev O., Turdalyuly M., Mekebayev N., Turdalykyzy T., Shayakhmetova A. AUTOMATIC KAZAKH SPEECH RECOGNITION WITH DNN. Herald of the Kazakh-British Technical University. 2019;16(2):134-142. (In Russ.)

Қараулар: 613


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)