Б60 |
Биков, М. М. Моделювання процесу аналізу і класифікації голосових команд [Текст] : монографія / М. М. Биков, Т. В. Грищук. – Вінниця : ВНТУ, 2009. – 128 с.
В монографії проведено ґрунтовний аналіз процесу аналізу і класифікації голосових команд. Для моделювання процесу аналізу і класифікації голосових команд розроблено математичну модель оптимізації цього процесу у вигляді дерева класифікації. Представлено математичну модель мовного сигналу на рівні попередньої обробки та математичну модель синтаксичного аналізу і класифікації голосових команд на граматичних марковських мережах. Запропонована технологія розпізнавання узагальнює процеси синтаксичного аналізу формальної граматики та класифікації вхідних голосових команд, що дає можливість скорочувати варіанти в процесі класифікації без втрат достовірності класифікації.
Монографія розрахована на науковців, фахівців з питань розпізнавання мови, викладачів, аспірантів, студентів.
ЗМІСТ
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ....................................................................5
ВСТУП......................................................................................................................7
РОЗДІЛ 1. АНАЛІЗ СУЧАСНОГО СТАНУ МОДЕЛЮВАННЯ
ПРОЦЕСУ АНАЛІЗУ І КЛАСИФІКАЦІЇ ГОЛОСОВИХ КОМАНД………...10
1.1. Класифікація систем розпізнавання мови....................................................10
1.2. Аналіз математичних моделей класифікації мовних сигналів..................13
1.2.1. Акустичне моделювання.............................................................................13
1.2.2. Динамічне програмування..........................................................................14
1.2.3. Статистична класифікація мовних образів...............................................16
1.2.4. Приховані марковські моделі....................................................................18
1.2.5. Штучні нейронні мережі............................................................................23
1.3. Аналіз математичних моделей мовоутворення і мовосприйняття...........25
1.3.1. Лінійна модель мовоутворення.................................................................26
1.3.2. Модель мовоутворення на основі лінійного прогнозу………………...27
1.3.3. Математична модель мовосприйняття.....................................................28
1.4. Визначення способів представлення мови на синтаксичному рівні........29
Висновки та постановка задач досліджень........................................................34
РОЗДІЛ 2. МАТЕМАТИЧНІ МОДЕЛІ ПРОЦЕСУ АНАЛІЗУ І КЛАСИФІКАЦІЇ ГОЛОСОВИХ КОМАНД......................................................36
2.1. Вибір критерію ефективності систем розпізнавання мови.......................36
2.2. Метод оцінки ефективності систем розпізнавання мови...........................37
2.2.1. Оцінка інформативності систем розпізнавання мови на лексичному рівні.......37
2.2.2. Оцінка інформативності систем розпізнавання мови на синтаксичному рівні.......44
2.3. Математична модель оптимізації процесу класифікації голосових команд.......49
2.4. Математичні моделі процесу аналізу і класифікації голосових команд на різних рівнях ієрархії........55
2.4.1. Математична модель мовного сигналу на рівні попереднього аналізу мовної інформації.............56
2.4.2. Механізм виведення фраз формальної граматики...............................62
2.4.3. Математична модель процесу аналізу і класифікації голосових команд на граматичних марковських мережах............................................................69
РОЗДІЛ 3. ЗАСТОСУВАННЯ МАТЕМАТИЧНИХ МОДЕЛЕЙ ДЛЯ ОПТИМІЗАЦІЇ ПРОЦЕСУ КЛАСИФІКАЦІЇ ГОЛОСОВИХ КОМАНД…..76
3.1. Реалізація процедури ефективної стратегії класифікації голосових команд для випадку моделювання дискурсу....................................................76
3.2. Метод класифікації голосових команд на базі прихованих марковських мереж.....................................................................................................................81
3.2.1. Якість класифікації фонеми......................................................................81
3.2.2. Оптимізація процесу класифікації голосових команд за критерієм якості класифікації фонем...................................................................................84
3.2.3. Використання інформації про тривалість звучання фонем для збільшення швидкодії процесу класифікації.....................................................87
3.2.4. Динамічне скорочення варіантів перебору в процесі класифікації голосових команд................................................................................................93
3.2.5. Скорочення варіантів перебору N-Best-Node.........................................94
3.3. Метод кодування мовних образів ранговими кодами та математичної моделі нейронної мережі, призначеної для класифікації.................................95
РОЗДІЛ 4 ПРОГРАМНЕ СЕРЕДОВИЩЕ ПРОЕКТУВАННЯ СИСТЕМ РОЗПІЗНАВАННЯ ГОЛОСОВИХ КОМАНД ТА ЕКСПЕРИМЕНТАЛЬНІ ДОСЛІДЖЕННЯ................................................................................................102
4.1. Методика проектування та оптимізації систем розпізнавання голосових команд................................................................................................................102
4.2. Інструментарій для розробки КВ-граматик.............................................104
4.2.1. Загальна функціональність....................................................................104
4.2.2. Синтаксис запису граматик...................................................................105
4.3. Інструментарій для розробки граматичних марковських мереж..........106
4.4. Дослідження адекватності "'квазічастотної" моделі мовного сигналу....109
4.5. Дослідження адекватності математичної моделі та методу класифікації голосових команд на базі прихованих марковських мереж.........................114
4.5.1. Класифікація голосових команд з врахуванням спільного граматичного майбутнього граматичних ланцюжків............................................................114
4.5.2. Класифікація голосових команд з використанням інформації про тривалість звучання фонем..............................................................................115
4.5.3. Динамічне скорочення варіантів перебору..........................................116
4.5.4. Оцінка достовірності прийнятого рішення за критерієм ефективності систем розпізнавання мови...............................................................................117
4.5.5. Оцінка достовірності прийнятого рішення за критерієм якості класифікації послідовності фонем прихованої марковської мережі............118
ВИСНОВКИ.......................................................................................................119
ЛІТЕРАТУРА.....................................................................................................120
|