Оптимальные и субоптимальные алгоритмы обработки речевых сообщений при наличии аддитивных искажений
При решении задачи верификации в качестве параметрического описания эталонного и верифицируемого слов длительностью порядка или менее 0,5 сек эффективно использовать коэффициенты авторегрессионных моделей 24-го порядка, получаемых из исходных речевых сигналов путем их фильтрации набором режекторных фильтров на частотах основного тона и пяти первых обертонов и фильтра верхних частот с частотой… Читать ещё >
Содержание
- 1. ПОДАВЛЕНИЕ АДДИТИВНЫХ ПОМЕХ В РЕЧЕВЫХ 8 СООБЩЕНИЯХ
- 1. 1. Постановка задачи подавления аддитивных помех в речевых сообщениях
- 1. 2. Подавление стационарных помех в речевых сообщениях
- 1. 3. Подавление эхо-помех в речевых сообщениях
- 1. 4. Выводы
- 2. ВЕРИФИКАЦИЯ ЛИЧНОСТИ НА ОСНОВЕ СТАТИСТИЧЕСКИХ СВОЙСТВ РЕЧЕВЫХ СООБЩЕНИЙ
- 2. 1. Постановка задачи
- 2. 2. Способы статистического описания речевых сообщений
- 2. 3. Верификация личности по сформированному речевому сообщению
- 2. 4. Выводы
- 3. НИЗКОСКОРОСТНОЕ КОДИРОВАНИЕ РЕЧЕВЫХ СООБЩЕНИЙ
- 3. 1. Принципы работы и практическая реализация речевого кодека, совместимого со стандартами IS-96-A и IS
- 3. 2. Построение речепреобразующих устройств на основе метода линейного предсказания со смешанным возбуждением
- 3. 3. Проектирование низкоскоростных речепреобразующих устройств для каналов с высоким процентом ошибок
- 3. 4. Выводы
- 4. ВОССТАНОВЛЕНИЕ РЕЧЕВЫХ СООБЩЕНИЙ МЕТОДОМ РЕКОНСТРУКТИВНОЙ ТОМОГРАФИИ
- 4. 1. Функциональная модель периферии слуха
- 4. 2. Восстановление речевых сообщений на основе метода реконструктивной томографии
- 4. 3. Восстановление речевых сообщений на основе метода реконструктивной томографии по зашумленным данным
- 4. 4. Выводы
Оптимальные и субоптимальные алгоритмы обработки речевых сообщений при наличии аддитивных искажений (реферат, курсовая, диплом, контрольная)
В настоящее время техническая информатика представляет собой широкую и быстро развивающуюся область, включающую в себя как чисто физические проблемы, так и разнообразные прикладные вопросы. Одной из важных теоретических и практических задач является разработка новых методов и алгоритмов обработки речевых сообщений. В качестве основных направлений исследований здесь можно выделить четыре направления: фильтрация речевых сообщений на фоне помех различной природы, аутентификация личности по голосу, низкоскоростное кодирование речевых сигналов и распознавание речи.
К сожалению, известные на текущий момент алгоритмы обработки речевых сообщений не свободны от недостатков. Так, приводимые в литературе [10,22,23,55,56 и др.] алгоритмы адаптивной линейной и нелинейной фильтрации, в частности, предполагающие наличие марковской модели сообщения, требуют достаточно большого объема априорной информации, либо существенно зависят от выбора начальных параметров модели и не всегда обеспечивают достаточно высокое выходное отношение сигнал/шум (ОСШ). Алгоритмы аутентификации [19,28,39 и др.] подразумевают, как правило, достаточно сложное параметрическое описание речевых сообщений и не всегда обеспечивают желаемую точность правильного принятия решения. Применение рекомендуемых алгоритмов низкоскоростного кодирования речевых сообщений [15,24,82,89 и др.] для передачи информации по каналам с высоким процентом ошибок приводит к существенному ухудшению узнаваемости диктора и фразеологической разборчивости речи. Наконец, до сих пор остается открытым вопрос об эффективных методах восстановления скрытых речевых сообщений и адекватных радиотехнических моделях голосовой и слуховой систем [35−38].
Целью работы является.
1. Синтезировать эффективные алгоритмы фильтрации речевых сообщений, искаженных стационарными (фоновыми) и нестационарными (эхо) помехами.
2. Разработать эффективный алгоритм верификации диктора по голосу на основе статистических свойств речевых сообщений.
3. Определить эффективные алгоритмы низкоскоростного (до 2400 бит/с и ниже) кодирования речевых сообщений. Найти структуру алгоритма для канала передачи информации с высоким (до 5%) процентом ошибок.
4. На основе метода реконструктивной томографии разработать модели формирователей слухового спектра (для распознавания свойств голосового тракта) и интонационного портрета (для распознавания источника голосового возбуждения).
5. Выполнить практическую реализацию предложенных алгоритмов обработки речевых сообщений в реальном масштабе времени на современной элементной базе.
Поставленные в диссертации вопросы исследовались в четырех разделах.
В первом разделе получены новые практически реализуемые алгоритмы фильтрации речевых сообщений на фоне помех. Рассмотрены два важных с практической точки зрения случая: 1) когда наблюдению доступна аддитивная смесь речевого сообщения и стационарного шума- 2) когда в дополнении к наблюдаемой реализации имеется канал, содержащий сигнал, коррелированный с шумомусловие стационарности шума при этом может нарушаться. Показано, что синтезированные алгоритмы являются достаточно универсальными, требуют минимального объёма априорной информации и позволяют существенно улучшить качество звучания (восприятия). Выполнена их программная (с помощью системы Math-Lab 8.0) и аппаратная (на базе цифрового процессора обработки сигналов (ЦПОС) TMS320VC5410A) реализация в реальном масштабе времени.
Во втором разделе выполнены синтез, анализ и практическая реализация алгоритма верификации личности на основе статистических характеристик речевых сообщений. Найдено преобразование, позволяющее аппроксимировать исходное речевое сообщение (парольное слово) стационарным эргодическим случайным процессом авторегрессии конечного порядка. Исследованы различные меры различимости двух речевых сообщений, представленных авторегрессионными коэффициентами, и выбрана наилучшая из них. Методами статистического моделирования и с помощью аппаратной реализации на базе ЦПОС TMS320VC5410A установлена работоспособность и достаточно высокая эффективность предложенного алгоритма верификации личности по голосу.
В третьем разделе рассмотрены принципы работы речевых кодеков на основе методов линейного предсказания с возбуждением от кода (CELP-вокодер) или со смешанным возбуждением (MELP-вокодер). Исходя из критериев желаемого качества кодированной речи, скорости битового потока, устойчивости речевого преобразования к канальным ошибкам, минимума затрачиваемых ресурсов цифрового сигнального процессора синтезированы и практически реализованы QCELP-вокодеры со скоростями 8000−13 200 бит/сMELP-вокодеры со скоростями 1200−2400 бит/с и высоким качеством речи, сохраняющимся при 1% ошибок в каналеMELP-вокодер со скоростью 2400 бит/с с удовлетворительным уровнем разборчивости речи, сохраняющимся при 5% ошибок в канале. Экспериментально с помощью программного (на языке высокого уровня С) и аппаратного (на базе ЦПОС TMS320VC5410A) моделирования установлена работоспособность и эффективность предложенных речепреобразующих устройств. Указаны пути дальнейшего понижения скорости битовых потоков вокодеров.
В четвертом разделе исследованы возможности восстановления скрытого от наблюдения речевого сообщения на основе метода реконструктивной томографии. В пренебрежении и с учетом мешающего действия шумов синтезированы алгоритмы формирования скрытого речевого сообщения по текущей спектральной плотности наблюдаемого речевого сигнала с помощью обратного преобразования в пространстве Радона. Для последнего случая с целью получения устойчивых и корректно работающих алгоритмов томографической реконструкции зашумленных речевых сообщений разработаны регуляризирующие процедуры весовой функции во временной или частотной областях. Показано, что полученные результаты имеют достаточно общий характер и могут быть использованы при проектировании систем автоматического формирования речевых сообщений по их проекционным данным.
В заключении подводятся итоги проведенных исследований, сформулированы выводы по работе в целом.
В приложении 1 исследованы различные полиномиальные аппроксимации наиболее часто встречающихся на практике нелинейных функций. Выполнен сравнительный анализ этих аппроксимаций между собой, а также с аппроксимациями, приведенными в литературе. Сформулированы критерии в пользу выбора того или иного полиномиального приближения заданной нелинейной функции, исходя из специфики задачи, а также с учетом ограничений, определяемых точностью алгоритма и быстродействием системы.
В приложении 2 рассмотрено представление сигналов через обобщенные спектры, полученные на основе различных систем ортогональных многочленов. Предложены быстрые методы спектрального анализа, использующие квадратурные формулы повышенной точности. Исследованы погрешности полиномиальных аппроксимаций, и сформулированы критерии выбора оптимального ортогонального базиса для вычисления обобщенного спектра.
Результаты диссертационной работы докладывались на 4 Международных и 6 научно-технических конференциях, опубликованы в работах [97−107] и использовались в разработках ОАО «Электросигнал» (г. Воронеж) и ЗАО «СПРОС ИТ» (г. Москва).
Результаты работы имеют достаточно общий характер и могут быть использованы при проектировании цифровых систем передачи речевых сообщений промышленного и военного назначения, автоматических систем опознавания личности по голосу, перспективных систем распознавания речевых сигналов, систем аппаратурного анализа случайных процессов, в различных областях радиотехники, связанных с цифровой обработкой случайных и детерминированных сигналов.
ЗАКЛЮЧЕНИЕ
.
Диссертационная работа посвящена синтезу, анализу, моделированию и практической реализации эффективных алгоритмов фильтрации, верификации, кодирования и восстановления речевых сообщений.
В работе получены следующие основные результаты.
1. Предложены и развиты методики синтеза алгоритмов фильтрации речевых сигналов на фоне стационарных и эхо-помех, алгоритмов верификации личности по голосу, алгоритмов низкоскоростной передачи речевых сообщений в каналах связи с высоким процентом ошибок, томографических алгоритмов восстановления речевого сообщения, скрытого в наблюдаемом речевом сигнале.
2. На основе предложенных методик синтезированы алгоритмы подавления стационарных и эхо-помех в речевых сигналах, алгоритм верификации личности по парольному слову, алгоритмы кодирования речевых сигналов на скоростях до 1200 бит/с при различных состояниях канала связи, алгоритмы автоматического формирования и восстановления речевых сообщений, в том числе по зашумленным проекционным данным слуховой системы.
3. С помощью современных средств программирования и на платформе цифрового процессора обработки сигналов TMS320VC5410A выполнена практическая реализация синтезированных шумои эхоподавите-лей, системы верификации личности по парольному слову длительностью до 0,5 с, вокодеров с линейным предсказанием с возбуждением от кода, работающих на скоростях 8000−13 200 бит/с, вокодеров со смешанным возбуждением, работающих на скоростях 1200−2400 бит/с при ошибках в канале связи до 1% и на скоростях до 2400 бит/с при ошибках в канале связи до 5%. Установлена работоспособность и эффективность всех спроектированных устройств.
4. Указаны пути дальнейшего повышения качества функционирования алгоритмов кодирования и распознавания речевых сообщений. Раскрыты возможности и перспективы построения моделей речеобразования и слуховой системы на основе метода реконструктивной томографии.
На основе результатов, полученных в диссертационной работе, можно сделать следующие выводы.
1. Развитая в работе методика синтеза алгоритмов фильтрации речевых сигналов, основанная на различиях в изменении спектра полезного сигнала и помехи, позволяет получить практически реализуемый в реальном масштабе времени на базе современных цифровых устройств алгоритм подавления стационарных шумов в речевых сообщениях, обеспечивающий выходное отношение сигнал/шум не менее 9 дБ. Если условие стационарности помехи, искажающей речевой сигнал, нарушается, но имеется дополнительный канал, сигнал в котором коррелирован с помехой и не коррелирован с речевым сообщением, то для борьбы с помехами (эхо-помехами) эффективным оказывается применение модифицированного алгоритма наименьших средних квадратов. Эхоподавитель, работающий по данному правилу, позволяет существенно повысить качество речи и комфортность звучания и по своим характеристикам превосходит имеющиеся отечественные аналоги.
2. При решении задачи верификации в качестве параметрического описания эталонного и верифицируемого слов длительностью порядка или менее 0,5 сек эффективно использовать коэффициенты авторегрессионных моделей 24-го порядка, получаемых из исходных речевых сигналов путем их фильтрации набором режекторных фильтров на частотах основного тона и пяти первых обертонов и фильтра верхних частот с частотой среза 50 Гц. Сравнение эталонного и верифицируемого слов целесообразно производить на основе метрики в пространстве линейного предсказания, определяющейся с помощью корреляционной матрицы эталонного речевого сигнала после обработки размером на единицу превышающим порядок модели авторегрессии. Тогда для реализации процесса верификации одного диктора в памяти системы достаточно хранить информацию, состоящую из 63 вещественных чисел, что существенно меньше требуемого объема памяти для параметрического описания речевых сигналов в действующих системах верификации. Построенный таким образом алгоритм обеспечивает точность верификации диктора по голосу не менее 99%, и, по крайней мере, не уступает по характеристикам имеющимся отечественным и зарубежным аналогам при существенно более простой технической реализации по сравнению с известными прототипами.
3. Для построения низкоскоростных речепреобразующих устройств (вокодеров), работающих на скоростях до 2400 бит/с и ниже, перспективным является использование метода линейного предсказания со смешанным возбуждением. Спроектированные на основе данного метода вокодеры могут обеспечивать словесную разборчивость речи не менее 95% при сохранении узнаваемости и интонационной окрашенности голоса диктора, если число ошибок в канале связи не превышает 1%. При высоком (до 5%) проценте канальных ошибок приемлемое качество синтезированной речи на тех же скоростях может быть получено путем снижения в 2 раза скорости передачи данных за счет замены несущественных речевых параметров на интерполированные значения параметров предыдущих фреймов и использования корректирующих кодов, таких как коды Хемминга (8,4) или коды Голея (23,12).
Дальнейшее понижение скорости битового потока вокодера со смешанным возбуждением возможно при использовании модифицированных кодовых книг, отражающих возможные сочетания линейных спектральных пар, и суммарного векторного кодирования речевых параметров. При этом ожидаемая скорость речепреобразующих устройств может составить не более 800 бит/с при словесной разборчивости речи не менее 90%.
4. Слуховая система человека построена по принципу реконструктивной томографии и может быть адекватно описана функциональной моделью, отображающей одномерное пространство входного сигнала в многомерный стохастический точечный процесс, допускающий пуассонов-скую аппроксимацию. При этом скрытое речевое сообщение определяется текущей спектральной плотностью наблюдаемого речевого сигнала и может быть восстановлено (при отсутствии шумов) по последней с помощью обратного преобразования в пространстве Радона. При наличии мешающего действия шумов наблюдения для восстановления скрытого речевого сообщения в формулах обращения преобразования Радона необходимо использовать регуляризирующие процедуры для весовых функций во временной или частотной областях. Получаемые при этом алгоритмы томографической реконструкции речевых сообщений обладают устойчивостью и позволяют корректно восстанавливать скрытые от непосредственного наблюдения речевые сообщения по зашумленным проекционным данным слуховой системы.
5. Синтезированные в работе оптимальные и субоптимальные алгоритмы обработки речевых сообщений могут быть реализованы на современной элементной базе с использованием цифровых сигнальных процессоров или программируемых логических интегральных схем.
Список литературы
- Акоев Г. Н., Андрианов Ю. Н. Синаптическая передача в рецепторах акустико-латеральной системы. — Л.: Наука, 1989. — 139 с.
- Андерсон Т. Статистический анализ временных рядов. — М.: Мир, 1976. -775 с.
- Блаттер К. Вейвлет-анализ. Основы теории: Пер. с нем. Учебное пособие. М.: Техносфера, 2004. — 273 с.
- Бовбель Е.И., Хейдоров И. Э. Статистические методы распознавания речи: скрытые марковские модели // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники, 1998. — № 3. — С.45−65.
- Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. -М.: Мир, 1974. Вып. 2.-408 с.
- Вольтерра В. Теория функционалов, интегральных и интегро-дифференциальных уравнений. М.: Наука, 1982. — 304 с.
- Гоноровский И.С. Радиотехнические цепи и сигналы: Учебник для вузов. -М.: Изд. «Дрофа», 2006. 719 с.
- Градштейн И.С., Рыжик И. М. Таблицы интегралов, сумм, рядов и произведений. М.: Наука. ГР ФМЛ, 1971. — 1108 с.
- Громаков Ю.А. Стандарты и системы подвижной радиосвязи. М.: ЭкоТрендз Ко, 2000. — 239 с.
- Гурьев Ю.Ю. Марковская нелинейная фильтрация речевого сигнала из смеси со стационарным шумом // Радиотехника, 1983. № 12. — С. 48−51.
- Дженкинс Г., Ватте Д. Спектральный анализ и его приложения М.: Мир, 1972. Вып. 1.-316 с. Вып. 2.-287 с.
- Драган Я.П., Рожков В. А., Яворский И. Н. Методы вероятностного анализа ритмики океанологических процессов. Л.: Гидрометеоиздат, 1987. -320 с.
- Климов Г. П. Инвариантные выводы в статистике. М.: Мир, 1973. -200 с.
- Корн Г., Корн Т. Справочник по математике для научных работников. — М.: Наука, 1984. 831 с.
- Коротаев Г. А. Эффективный алгоритм кодирования речевого сигнала на скорости 4.8 кбит/с и ниже // Зарубежная радиоэлектроника, 1996. -№ 3. С. 52−68.
- Купер Дж., Макгиллем К. Вероятностные методы анализа сигналов и систем: Пер. с англ. — М.: Мир, 1989. 376 с.
- Маркел Дж., Грэй А. Х. Линейное предсказание речи: Пер. с англ. — М.: Связь, 1980.-308 с.
- Марпл-мл. С. Л. Цифровой спектральный анализ и его приложения: Пер. с англ. М.: Мир, 1990. — 584 с.
- Мартынович П.В. Специфика детектора речи для системы верификации диктора по голосу // Цифровая обработка сигналов, 2004. № 3.-С.4−8.
- Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. — М.: Диалог-МИФИ, 2003. 384 с.
- Мысовских И.П. Лекции по методам вычислений. СПб.: Изд. СПбГУ, 1998.-472 с.
- Назаров М.В., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. — 176 с.
- Назаров М.В., Прохоров Ю. Н., Ковязин В. И. Алгоритмы адаптивной марковской фильтрации зашумленных речевых сигналов // Радиотехника, 1983. -№ 12.-С. 10−15.
- Невдяев Л.М. CDMA: IS-95 // Сети. 2000. — № 3. — С. 6−8.
- Оппенгейм А.В., Шафер Р. В. Цифровая обработка сигналов. М.: Связь, 1979.-416 с.
- Оппенгейм А., Шафер Р., Стокхэм-мл Т. Нелинейная фильтрация сигналов, представленных в виде произведения и свертки // ТИИЭР, 1968. -Т. 56.- № 8.
- Попков Ю.С., Ашимов А. А., Асаубаев К. Ш. Статистическая теория автоматических систем с динамической частотно-импульсной модуляцией. — М.: Наука, 1988.-256 с.
- Прохоров А.А. Биометрия на службе безопасности // Компьютерпресс, 2000. № 3. — С. 68−73.
- Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов. -М.: Радио и связь, 1984. 240 с.
- Рабинер JL, Голд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978. — 440 с.
- Рабинер JI. Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ. — М.: Радио и связь, 1981. 495 с.
- Рамишвили Г. С. Автоматическое опознавание говорящего по голосу. М.: Радио и связь, 1981. — 224 с.
- Розенберг А. Автоматическая верификация диктора: Обзор // ТИИЭР, 1976. Т. 64. — № 4. с. 66−79.
- Самарский А.А., Гулин А. В. Численные методы. М.: Наука, 1989. -429 с.
- Санников В.Г. Слуховой прием звуковых сигналов и реконструктивная томография. // Четвертая Межрегиональная НТК «Обработка сигналов в системах двусторонней телефонной связи», 20−24 марта 1995 г., Москва, МНТО РЭС им. А. С. Попова. С. 136 — 138.
- Санников В.Г. Теоретический анализ заметности искажений речевых сигналов по громкости их слухового восприятия // Электросвязь, 2002.-№ 12.-С. 38−42.
- Санников В.Г. Устойчивый алгоритм статистической идентификации авторегрессионной модели речевого сигнала. // Цифровая обработка сигналов, 2001. — № 2. С. 10−14.
- Санников В.Г., Коробанов А. В. Пороговые кривые маскировки и слуховые вейвлеты // INTERMATIC-2005. Ч. 2. Материалы IV Международной НТК «Фундаментальные проблемы радиоэлектронного приборостроения», 25−28 октября 2005 г., Москва. — С. 63−66.
- Свириденко В.А. Речевые технологии в биометрике: верификации и идентификация диктора // Материалы Первой биометрической конференции «Биометрия-2002″, Москва, 2002 (CD).
- Cere Г. Ортогональные многочлены. — М.: Физматгиз, 1962. 500 с.
- Серебренников М.Г., Первозванский А. А. Выявление скрытых периодичностей. — М.: Наука, 1965. -244 с.
- Сиберт У. Преобразование стимула в периферической слуховой системе. В кн. „Распознавание образов. Исследование живых и автоматических распознающих систем“: Пер. с англ. — М.: Мир, 1970. — С. 134−169.
- Слепов Н. Оценка показателей ошибок цифровых линий передачи // Электроника: Наука, Технология, Бизнес, 2002. -№ 5. С. 22−28.
- Слуховая система. / Ред. Я. А. Альтман Л.: Наука, 1990. — 620 с.
- Солонина А.И., Улахович Д. А., Яковлев Л. А. Алгоритмы и процессоры цифровой обработки сигналов. — СПБ.: БХВ-Петербург, 2002. — 464 с.
- Тихонов А.Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука. ГР ФМЛ, 1986. — 288 с.
- Тихонов А.Н., Арсенин В. Я., Тимонов А. А. Математические задачи компьютерной томографии. — М.: Наука. ГР ФМЛ, 1987. 160 с.
- Троицкий И.Н. Статистическая теория томографии.- М.: Радио и связь, 1989.-240 с.
- Фант Г. Акустическая теория речеобразования. М.: Наука, 1964.284 с.
- Фант Г. Анализ и синтез речи. Новосибирск: Наука, 1970. — 306 с.
- Фланаган Дж. Анализ, синтез и восприятие речи. — М.: Связь, 1968. -396 с.
- Фланаган Дж. Вычислительные машины говорят и слушают. Речевое сообщение человека с машиной // ТИИЭР, 1976. Т. 64. — № 4. — С. 78−91.
- Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. / Под ред. Б. Г. Белкина М.: Связь, 1971. — 256 с.
- Цифровая обработка компьютерных и телевизионных изображений / под ред. Ю. Б. Зубарева, В. П. Дворковича. М.: МЦНТИ, 1997. — 442 с.
- Чучупал В .Я., Чичагов А. В., Маковкин К. А. Цифровая обработка речевых сигналов // Internet Publish: http://www.ccas.ru/DCM/Chichag/index.htm.
- Шелухин О.И., Лукьянцев Н. Ф. Цифровая обработка и передача речи. — М.: Радио и связь, 2000. 456 с.
- Шельгов В.И. Новое в технологии TETRA // Сети и системы связи, 2004.-№ 5.-С. 76−77.
- R. Abouchakra Delay Estimation for Transform Domain Acoustical Echo Cancellation. Department of Electrical Engineering, McGill University, Montreal, Canada, September 1997. 89 p.
- Acoustic-Echo Cancellation Software for Hands-Free Wireless Systems // Application Report: SPRA 162, Texas Instruments, July 1997 81 p.
- G. von Bekesy Experiments in Hearing. McGraw-Hill Book Company. New York, 1960.-37 p.
- S.F. Boll „A spectral subtraction algorithm for suppression of acoustic noise in speech“ // Proc. IEEE Int. Conf. on Acoustics, Speech, Signal Processing, (Washington, DC), pp. 200−203, Apr. 1979.
- D. van Compernolle „Hearing aids using binaural processing principles“ //Acta Otolaryngologica Suppl., vol. 469, pp. 76−84, 1990.
- D. van Compernolle, W. Ma, F. Xie, and M. van Diest „Speech recognition in noisy environments with the aid of microphone arrays“ // Speech Commun., vol. 9, pp. 433−442, Dec. 1990.
- J.R. Deller, Jr., J.H.L. Hansen, and J.G. Proakis Discrete Time Processing of Speech Signals (2d ed.). New York: IEEE Press, 2000. 800 p.
- Digital Signal Processing Applications Using the ADSP-2100 Family. Volume 1 / Prentice Hall, Englewood Cliffs, NJ 7 632, 1992. 591 p.
- Digital Signal Processing Laboratory Using the ADSP-2101 Microcomputer / Analog Devices, Inc., Norwood, MA 2 062, 1991. 300 p.
- N. Dillier et al. „Digital signal processing (DSP) applications for multiband loudness correction digital hearing aids and cochlear implants“ // J. Rehab. Res. Dev., vol. 30, pp. 95−109, 1993.
- A. Gersho, S. Wang, and K. Zeger „Vector Quantization Techniques in Speech Coding, Advances in Speech Signal Processing“ // S. Furui and M. Sondhi editors, Marcel Dekker, Inc., NewYork, pp. 49−84, 1992.
- J.E. Greenberg „Modified LMS Algorithms for Speech Processing with an Adaptive Noise Canceller“ // IEEE Trans. Speech Audio Processing, vol. 6, pp. 338−351, July 1998.
- J.E. Greenberg and P.M. Zurek „Evaluation of an adaptive-beamforming method for hearing aids“ // J. Acoust. Soc. Amer., vol. 91, pp. 1662−1676, Mar. 1992.
- W.A. Harrison, J.S. Lim, and E. Singer „A new application of adaptive noise cancellation“ // IEEE Trans. Acoust., Speech Signal Processing, vol. 34, pp.21−27, Feb. 1986.
- W.M. Hartmann Signals, Sound, and Sensation. Springer Verlag, 1997.168 p.
- Implementing a Line-Echo Canceller Using theBlock Update and NLMS Algorithms on the TMS320C54x DSP // Application Report: SPRA 188, Texas Instruments, April 1997. — 36 p.
- F. Itakura and N. Sugamura „LSP Speech Synthesizer, its Principle and Implementation“ // ASJ Trans, of the Com. on Speech Res., S79−46, pp. 349−356, Nov. 1979.
- S. Makino, Y. Kaneda, and N. Koizumi „Exponentially weighted stepsize NLMS adaptive filter based on the statistic of a room impulse response“ // IEEE Trans. Speech Audio Processing, vol. 1, pp. 101−108, Jan. 1993.
- J.A. Maxwell and P.M. Zurek „Reducing acoustic feedback in hearing aids“ // IEEE Trans. Speech Audio Processing, vol. 3, pp. 304−313, July 1995.
- D.G. Messerschmitt „Echo cancellation in the speech and data transmission“ // IEEE J. Select. Areas Commun., vol. 2, pp. 283−297, Mar. 1984.
- Mouly M., Pautet M.-B. The GSM System for Mobile Communication. Europe Media Duplication, 1992. 702 p.
- D. O’Shaughnessy Speech Communication: Human and Machine. Addison Wesley, New York, NY, USA, 1987. 237 p.
- Panos E. Papamichalis „Practical Approaches to Speech Coding“. Prentice-Hall, Inc. Upper Saddle River, NJ, USA, 1987. 322 p.
- J. Picone „Signal Modeling Techniques in Speech Recognition“ // IEEE Proceedings, vol. 81, no. 9, pp. 1215−1247, September 1993.
- L.R. Rabiner, B.H. Juang Fundamentals of Speech Recognition. Prentice-Hall, Inc., Englewood Cliffs, N.J., 2nd edition, 1999. 496 pp.
- C. Redding, N. DeMinco, J. Lindner Voice Quality Assessment of Vocoders in Tandem Configuration // National Communications System’s Office of Standards and Technology, Washington, DC, No. DNRO 66 008. 2001. — 21 p.
- T. Robinson Speech Analysis. Lent Term, 1995. 44 p.
- D.T.M. Slock „On the convergence behavior of the LMS and normalized LMS algorithms“ // IEEE Trans. Signal Processing, vol. 41, pp. 2811−2825, Sept. 1993.
- M.M. Sondhi and D.A. Berkley „Silencing echoes on the telephone network“ // Proc. IEEE, vol. 68, pp.948−963, Aug. 1980.
- A.S. Spanias „Speech coding: A tutorial review“ // Proc. of the IEEE, Vol. 82, No. 10, October 1994, pp.1541−1582.
- Lynn M. Supplee, Alan V. McCree „Melp: The New Federal Standart at 2400 bps“ // International conference on acoustics, speech, and signal processing, Munich, ALLEMAGNE (21/04/1997), pp. 1591−1594.
- TIA/EIA/IS-733 High Rate Speech Service Option 17 for Wideband Spread Communication System / Telecommunications Industry Association, 1998. -124 p.
- TIA/EIA/IS-96-A Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System / Telecommunications Industry Association, 1995.-96 p.
- S.V. Vaseghi Advanced Signal Processing and Digital Noise Reduction. Wiley Teubner, 1996. 141 p.
- R. Wehrmann, J. Van Der List, and P. Meissner „A noise-insensitive compromise gradient method for the adjustment of adaptive echo cancellers“ // IEEE Trans. Commun., vol. 28, pp. 753−759, May 1980.
- M.Weiss „Use of an adaptive noise canceller as an input preprocessor for a hearing aid“ // J. Rehab. Res. Dev., vol. 24, pp. 93−102, 1987.
- B. Widrow, S.D. Stearns Adaptive Signal Processing. Prentice-Hall, Inc., Englewood Cliffs, N. J., 1985. 99 p.
- Максимов М.И. Применение качественной математики с лингвистическим типом переменных при разработке экспертных систем для решения некоторых задач связи // Прикл. матем. в задачах связи / Моск. техн. ун-т связи и информатики М.: МТУ СИ, 2000. — С. 62−74.
- Максимов М.И. Применение модифицированной кластеризации по с-средним при анализе изображений // Прикл. матем. в задачах связи / Моск. техн. ун-т связи и информатики М.: МТУ СИ, 2000. — С. 52−61.
- Максимов М.И. Применение М-кластеризации по с-средним с использованием функций принадлежности второго рода при анализе изображений // Международная научно-практическая конференция
- Фундаментальные проблемы радиоэлектронного приборостроения» Intermatic-2006: Матер, конф. М.: МИРЭА, ЦНИИ «Электроника». — 2006. -Часть 2.-С. 92−95.
- Санников В.Г., Максимов М. И. Регуляризирующий алгоритм восстановления речевого сообщения методом реконструктивной томографии // Электросвязь. 2007. — № Ю. — С. 52−55,
- Максимов М.И., Сидорова Н. А., Чернояров О. В. Проектирование низкоскоростных речепреобразующих устройств для каналов с высоким процентом ошибок // Электросвязь, 2008. № 7. — С. 48−50.
- Максимов М.И., Сидорова Н. А. Принципы работы и практическая реализация речевого кодека на основе метода линейного предсказания с возбуждением от кода // Научно-технические ведомости СПбГТУ. 2008. -№ 5.-С. 75−81.