Зарегистрироваться
Восстановить пароль
FAQ по входу

Кудашев О.Ю. Система разделения дикторов на основе вероятностного линейного дискриминантного анализа

  • Файл формата pdf
  • размером 226,15 КБ
  • Добавлен пользователем
  • Описание отредактировано
Кудашев О.Ю. Система разделения дикторов на основе вероятностного линейного дискриминантного анализа
Автореферат диссертации на соискание ученой степени кандидата технических наук: 05.13.11 – Математическое обеспечение вычислительных машин, комплексов и компьютерных сетей. — Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики. — Санкт-Петербург, 2014. — 20 с.
Научный руководитель: к.т.н., доц. Пеховский Т.С.
Целью исследования является исследование и разработка методов разделения дикторов, которые с высокой эффективностью осуществляют решение поставленной задачи при условии отсутствия априорной информации о числе дикторов.
Для достижения поставленной цели были сформулированы и решены следующие основные задачи:
Исследование современных достижений в области разделения дикторов, а также в смежных областях, таких как тексто-зависимая и
тексто-независимая идентификация дикторов по голосу, распознавание речи.
Разработка и реализация методов разделения дикторов на фонограмме, позволяющих работать в условиях отсутствия априорной информации о числе дикторов.
Подготовка акустических баз для оценки параметров (обучения) и тестирования системы разделения дикторов.
Реализация программных средств системы разделения дикторов, осуществляющих решение поставленной задачи.
Проведение численных экспериментов, осуществляющих оценку качества разработанной системы, а также её сравнение с мировыми аналогами.
Научная новизна.
Разработана модель вероятностного линейного дискриминантного анализа (Probability Linear Discriminant Analysis, PLDA), применимой к задаче разделения дикторов.
Разработан метод кластеризации речевых сегментов при известном числе дикторов на основе вариационного байесовского анализа и методов спектральной кластеризации в рамках разработанной модели PLDA.
Разработан метод модельного отбора числа дикторов на фонограмме на основе PLDA.
Разработана система разделения дикторов на фонограмме, осуществляющая эффективное решение поставленной задачи в условиях отсутствия информации о числе дикторов.
Реализованы программные средства, включающие в себя набор модулей, осуществляющих оценку параметров и тестирование разработанной системы.
  • Чтобы скачать этот файл зарегистрируйтесь и/или войдите на сайт используя форму сверху.
  • Регистрация