СИСТЕМАТИЧЕСКИЙ ОБЗОР И АНАЛИЗ ОСОБЕННОСТЕЙ ИДЕНТИФИКАЦИИ ПО ГОЛОСУ

О. Ж. Мамырбаев; А. С. Кыдырбекова; А. Т. Ахмедиярова; М. Тұрдалыұлы; Н. О. Мекебаев

СИСТЕМАТИЧЕСКИЙ ОБЗОР И АНАЛИЗ ОСОБЕННОСТЕЙ ИДЕНТИФИКАЦИИ ПО ГОЛОСУ

О. Ж. Мамырбаев, А. С. Кыдырбекова, А. Т. Ахмедиярова, М. Тұрдалыұлы, Н. О. Мекебаев

Полный текст:

PDF (Rus) |

сгенерировать QR код

Аннотация

Идентификация по голосу - это процесс идентификации говорящего по данному высказыванию путем сравнения голосовой биометрии высказывания с теми моделями высказывания, которые были сохранены заранее. Технологии идентификации по голосу получили новое направление благодаря достижениям в области искусственного интеллекта и широко используются в различных областях. Извлечение признаков является одним из наиболее важных аспектов идентификации по голосу, который существенно влияет на процесс и производительность идентификации. Этот систематический обзор проводится для выявления, сравнения и анализа различных подходов, методов и алгоритмов извлечения признаков для идентификации по голосу, чтобы предоставить справочную информацию о подходах извлечения признаков для приложений идентификации по голосу и будущих исследований. В ходе исследования были рассмотрены модели: основанные на шаблонах, основанные на векторном квантовании, динамическом переносе времени, модель гистограмм, стохастические модели, модели гауссовой смеси и скрытая Марковская модель, основанные на Mel-частотных кепстральных коэффициентах, генеративное или векторное квантование, дискриминационные модели (обычно с использованием методов машинного обучения, таких как SVM и ANN). Это исследование показало, что текущая тенденция исследования идентификации заключается в разработке надежной универсальной структуры идентификации по голосу для решения важных проблем идентификации по голосу, таких как адаптивность, сложность, многоязычное распознавание и устойчивость к шуму. Результаты, представленные в этом исследовании, основаны на прошлых публикациях, цитатах и количестве реализаций, причем цитаты являются наиболее актуальными. Эта статья также представляет общий процесс идентификации по голосу.