WWW.KONF.X-PDF.RU
БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Авторефераты, диссертации, конференции
 

Pages:   || 2 | 3 | 4 |

«МОДЕЛЬ, ЧИСЛЕННАЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ОЦЕНИВАНИЯ ЧАСТОТЫ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА С ПОМОЩЬЮ СИНГУЛЯРНОГО СПЕКТРАЛЬНОГО АНАЛИЗА ...»

-- [ Страница 1 ] --

ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ

УДК [004.934:519.614:004.42]

На правах рукописи

ВОЛЬФ ДАНИЯР АЛЕКСАНДРОВИЧ

МОДЕЛЬ, ЧИСЛЕННАЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ

ОЦЕНИВАНИЯ ЧАСТОТЫ ОСНОВНОГО ТОНА РЕЧЕВОГО



СИГНАЛА С ПОМОЩЬЮ СИНГУЛЯРНОГО

СПЕКТРАЛЬНОГО АНАЛИЗА

Специальность 05.13.18 – «Математическое моделирование, численные методы и комплексы программ»

ДИССЕРТАЦИЯ

на соискание учёной степени кандидата технических наук

Научный руководитель:

доктор технических наук, профессор Мещеряков Роман Валерьевич Т О М СК 2 0 1 5

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. Обзор существующих методов и алгоритмов оценивания частоты основного тона речи.

Обзор моделей вокализированного сегмента речевого сигнала. Постановка задачи

1.1. Анализ состояния проблемы оценки частоты основного тона речи....... 13 1.1.1. Методы оценки частоты основного тона речи

Обзор отечественных алгоритмов оценивания ЧОТ

1.1.2.

Обзор зарубежных алгоритмов оценивания ЧОТ

1.1.3.

Оценка существующих алгоритмов оценивания ЧОТ

1.1.4.

1.2. Модели вокализированного сегмента речевого сигнала

1.2.1. Волновая модель Келли-Локбаума

Модель речевого тракта на основе уравнения Вебстера................ 37 1.2.2.

Гармоническая модель вокализированного сегмента речи............ 38 1.2.3.

1.3. Сингулярная модель вокализированного сегмента речи

1.3.1. Прямая задача

Обратная задача

1.3.2.

1.4. Постановка задачи и требования к сингулярному оцениванию частоты основного тона речи

1.5. Выводы по главе

ГЛАВА 2. Модель и численная реализация сингулярного оценивания частоты основного тона речевого сигнала.

Оценка методов и алгоритмов сингулярного спектрального анализа речи

2.2. Построение концептуальной модели сингулярного оценивания мгновенной частоты основного тона речи

2.2.1. Общий вид модели сингулярного оценивания ЧОТ

Анализ модели общего вида

2.2.2.

Переход к частному случаю

2.2.3.

2.3. Построение математической модели сингулярного оценивания мгновенной частоты основного тона речевого сигнала

2.3.1. Численная реализация модели

Математическая модель сингулярного оценивания частоты 2.3.2.

основного тона

2.4. Сингулярный спектральный анализ речевого сигнала

2.4.1. Решение проблемы собственных чисел в задачах анализа речи.... 63 Преобразования Хаусхолдера с ротацией Гивенса

2.4.2.

Метод Ланцоша для аппроксимации края сингулярного спектра. 75 2.4.3.

2.5. Выводы по главе

ГЛАВА 3. Комплекс алгоритмов для программной реализации сингулярного оценивания частоты основного тона речи

3.1. Реализация генератора сингулярного спектра речевого сигнала............ 79 3.1.1. Синтез генератора сингулярного спектра речи

Процедура Ганкелизации фонемного ряда

3.1.2.

Алгоритмизация метода Ланцоша для задачи аппроксимации края 3.1.3.

сингулярного спектра речи

Алгоритмизация QR-RQ цепочки для отыскания собственных пар 3.1.4.

Ритца

Реконструкция квазигармонического сингулярного спектра речи 94 3.1.5.

Компоновка генератора сингулярного спектра речи

3.1.6.

3.2. Реализация средства выбора квазигармонической составляющей......... 99 3.1.1. Синтез селектора

Алгоритмизация измерителя частоты временного спектра........... 99 3.2.2.

Процедура выбора наилучшего кандидата с ЧОТ

3.2.3.

Процедура уточнения значения ЧОТ

3.2.4.

Компоновка селектора

3.2.5.

3.3. Алгоритм сингулярного оценивания частоты основного тона.............. 104

3.4. Выводы по главе

ГЛАВА 4. Программная реализация сингулярного оценивания частоты основного тона речевого сигнала.





Экспериментальные исследования с моделью

4.1. Программная реализации сингулярного оценивания ЧОТ

4.1.1. Структура программного комплекса

Программная реализация алгоритмов на уровне методов............ 108 4.1.2.

Общий вид работы программного комплекса

4.1.3.

4.2. Экспериментальные исследования с моделью

4.2.1. Оценка временных характеристик сингулярного оценивания ЧОТ речи

Оценка адекватности модели сингулярного оценивания ЧОТ.... 114 4.2.2.

Оценка достоверности модели сингулярного оценивания ЧОТ.. 117 4.2.3.

4.3. Выводы по главе

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

Приложение А. Свидетельство о государственной регистрации программы для ЭВМ

Приложение Б. Акт о внедрении в Томском НИИ онкологии

Приложение В. Протокол испытания сингулярного измерителя частоты основного тона речевого сигнала

Приложение Г. Акт о внедрении в МКУ «Единая дежурно-диспетчерская служба Сургутского района»

Приложение Д. Акт о внедрении в учебный процесс (ТУСУР)

ВВЕДЕНИЕ

Из всего живого только человека Создатель наградил даром речи [1], благодаря чему ему удалось столь значительно развить свои интеллектуальные способности и, по мнению многих философов, стать человеку человеком. Можно предположить, что нечто подобное происходит на наших глазах и с компьютером, интенсивно овладевающим широким спектром речевых технологий от работы со звуковыми файлами до синтеза, распознавания и понимания речи [2].

Создание систем распознавания речи, вокодерной телефонии, идентификации диктора по голосу связано с необходимостью выделения первичных признаков речевого сигнала в условиях реальной речевой обстановки [3]. Важнейшим параметром речевого сигнала является основной тон, содержащий информацию об интонационной структуре произнесения, индивидуальности голоса диктора и его эмоциональном состоянии, возрастных и патологических изменениях голосового аппарата [4, 5]. Данная научная работа направленна на решение проблемы оценивания частоты основного тона (ЧОТ) речевого сигнала. Задача определения ЧОТ речи, включая распределение амплитуд, периодов и начальных фаз гармоник, образующих сложный полигармонический сигнал, относится к классу сложных.

Существующие системы оценивания ЧОТ не позволяют проводить анализ речевой информации с учетом особенностей речеобразования и речевосприятия, связанных с анатомией и физиологией человека, так как методы анализа, лежащие в их основе, ограничены периодической (стационарной) моделью речевого сигнала, которая подразумевает точное повторение периода и амплитуды основного тона и не допускает их изменения на протяжении окна анализа. В свою очередь, это влияет на точность результатов оценивания ЧОТ. В данной научной работе предлагается модель речевого сигнала на основе сингулярного спектрального анализа (далее - сингулярная модель), которая позволяет рассматривать речеобразующий тракт как систему акустических резонаторов, в которой параметрами выступают собственные значения и собственные векторы, содержащие информацию о структуре речевого сигнала с учетом нестационарных амплитуд, периодов и фаз гармоник, входящих в его состав. Данное свойство обусловлено тем, что пространство собственных векторов образует нестационарный базис, в который проецируется речевой сигнал.

В медицинских приложениях речевых технологий повышение точности вычислений является актуальной задачей. Однако повышение точности вычисления ЧОТ приводит к увеличению вычислительной сложности. Разработанная новая модель оценивания частоты основного тона на основе сингулярного спектрального анализа (далее - сингулярное оценивание ЧОТ) позволяет сократить временную обработку речевого сигнала за счет аппроксимации края сингулярного спектра, выделяя главные компоненты, образующие речевой сигнал для случая неизвестных априорных распределений амплитуд, периодов и начальных фаз гармоник.

В качестве математического инструмента для исследования речевых сигналов выбран аппарат сингулярного спектрального анализа (ССА «Гусеница»), разработанного и обоснованного в конце XX века сотрудниками СанктПетербургского государственного университета [6, 7]. В современной зарубежной литературе описан широкий класс методов, алгоритмически и идейно близких к методу «Гусеница», в основном метод известен как Singular Spectrum Analysis (SSA) [8-10]. Метод основан на анализе главных компонент и позволяет исследовать стационарные и не стационарные временные ряды.

Связь между классическими методами анализа стационарных временных рядов и методом главных компонент рассматривается в работах Бриллинджера [11]. Например, в работе Bagshaw [12] утверждается, что методы, работающие во временной области, обладают наименьшей ошибкой, по сравнению с другими методами (частотными), принятия решения о присутствии голоса в речи (voicing decision error rate) – не более 17%. Кроме того, в работе [13] показано, что такие методы являются наиболее робастными в отношении принятия решения о вокализованном или невокализованном сегменте речи в условиях шума (voiced-unvoiced decision), искажений и побочных помех в сигнале.

Проблематикой эффективного оценивания ЧОТ речевого сигнала занимались такие ученые как Г. Фант, Дж. Фланаган, М.А. Сапожков, В.Н. Сорокин, В.И. Галунов, Б.М. Лобанов, Т.К. Винцюк, Л.В. Златоустова, А.В. Аграновский, Н.Г. Загоруйко, Ю.А. Косарев, А.Л. Ронжин, М.В. Хитров, С.Л. Коваль, В.Г.

Михайлов, В.П. Бондаренко, М.Б. Столбов, др. Поэтому настоящая научная работа посвящена решению проблемы оценивания частоты основного тона, так как разработка новых методов оценивания ЧОТ речи является актуальной задачей.

Цель исследования Целью исследования является уменьшение вычислительной сложности алгоритмов анализа речевого сигнала при оценивании частоты основного тона с учетом особенностей речеобразования и речевосприятия, связанных с анатомией и физиологией человека для случая неизвестных априорных распределений амплитуд, периодов, начальных фаз гармоник.

Для достижения поставленной цели в данной научной работе решается задача разработки модели оценивания частоты основного тона речевого сигнала, которая позволяет:

— уменьшить вычислительную сложность алгоритмов анализа речевого сигнала;

— учитывать особенности речеобразования и речевосприятия, связанных с анатомией и физиологией человека для случая неизвестных априорных распределений амплитуд, периодов, начальных фаз гармоник, а также численная и программная реализация модели.

Методика исследования Для решения задач, сформулированных в данной научной работе, использовались методы системного анализа, сингулярного спектрального анализа, цифровой обработки сигналов, математической статистики, фонетики, психоакустики.

Степень достоверности результатов работы Достоверность полученных результатов обеспечивается строгостью используемого математического аппарата, адекватностью и достоверностью модели, установленной путем сравнения реакции модели и известных аналогов на тестовые сигналы, большим количеством экспериментальных данных, подтверждающих теоретические результаты, а также внедрением разработанного комплекса алгоритмов в практику.

Научная новизна

Научную новизну настоящей работы определяют:

1. Модель оценивания частоты основного тона, основанная на сингулярном спектральном анализе, в отличие от классических моделей позволяет уменьшить вычислительную сложность алгоритмов анализа речевого сигнала.

2. Численный метод расчета частоты основного тона, использующий метод главных компонент для анализа временных рядов, в отличие от известных в литературе численных методов, учитывает особенности генерации речевого сигнала человеком и элементы психоакустики.

3. Комплекс алгоритмов, позволяющий разрабатывать программы, обеспечивающие меньшее количество ошибок оценивания частоты основного тона за счет использования сингулярной модели вокализированного сегмента речи, учитывающей нестационарные параметры основного тона с помощью собственных чисел.

Практическая значимость работы

Разработанные модель и алгоритмы позволят:

1) разрабатывать программное обеспечение для детального анализа параметров основного тона речевого сигнала в режиме реального времени;

2) формировать описание речевого сигнала для его распознавания, идентификации диктора и кодирования речи в цифровых системах связи.

Положения, выносимые на защиту

1. Использование модели сингулярного оценивания частоты основного тона позволяет уменьшить вычислительную сложность алгоритмов анализа речевого сигнала на 37% путем аппроксимации края сингулярного спектра.

2. Численный метод расчета частоты основного тона, использующий метод главных компонент, позволяет проводить анализ речевого сигнала человека с погрешностью не более 0,2%.

3. Комплекс алгоритмов сингулярного оценивания частоты основного тона позволяет разрабатывать программы, обеспечивающие меньшее количество ошибок оценивания частоты основного тона за счет использования сингулярной модели вокализированного сегмента речи, учитывающей нестационарные параметры основного тона с помощью собственных чисел.

Апробация работы По материалам диссертации опубликовано 16 работ, из них 5 статей в журналах, входящих в перечень рецензируемых научных журналов и изданий, 11 публикаций в материалах международных и всероссийских научных конференциях.

Внедрение результатов Разработанные модель и алгоритмы сингулярного оценивания частоты основного тона речи используются:

— в комплексе программ реабилитации пациентов после полной или частичной потери звучной речи в результате ларингоэктомии (Свидетельство о государственной регистрации программы для ЭВМ № 2015618857 – "Программа речевой реабилитации больных после резекции гортани"). Данный комплекс программ используется в кабинете логопеда отделения опухолей органов головы и шеи в Федеральном государственном бюджетном научном учреждении «Томский научно-исследовательский институт онкологии»;

— в качестве одного из модулей вокодера системы записи телефонных разговоров муниципального казенного учреждения «Единой дежурнодиспетчерской службы Сургутского района» – органа повседневного управления Сургутского районного звена территориальной подсистемы РСЧС (МКУ «ЕДДС Сургутского района»);

— в учебном процессе при выполнении научно-исследовательской работы студентами кафедры комплексной информационной безопасности электронно-вычислительных систем Томского государственного университета систем управления и радиоэлектроники (КИБЭВС) в части проведения группового обучения студентов кафедры КИБЭВС (Проект ФВС ГПО.5711305 -01 81 01 ПЗ «Сегментация речевых сигналов с применением быстрых численных методов») для подготовки специалистов по специальности 10.05.03 – Информационная безопасность автоматизированных систем, и 21.02.02 – Проектирование и технология электронно-вычислительных средств. Эффективная программная реализация алгоритмов сингулярного спектрального анализа речи позволила повысить скорость и объемы вычислительных экспериментов, проводимых в рамках базовой части государственного задания ТУСУР – проект № 3657 (2015г.) на базе лаборатории речевых технологий Центра технологий безопасности ТУСУР.

Личное участие автора в получении результатов Основные научные результаты получены лично автором. Постановка изложенных в диссертации задач сделана совместно с научным руководителем аспиранта профессором Мещеряковым Р.В. На основе проведенного анализа возможности снижения вычислительной сложности существующих алгоритмов оценивания частоты основного тона, автором были разработаны новые эффективные численные методы и алгоритмы, реализованные в виде комплекса программ. Автор применяет сингулярную модель вокализированного сегмента речевого сигнала с помощью которой разрабатывает модель, алгоритмы и программную реализацию сингулярного оценивания частоты основного тона речи.

C 2012 г. автор занимается решением прикладных задач анализа и синтеза речевых сигналов с помощью математического аппарата сингулярного спектрального анализа.

Теоретическая ценность научной работы.

Теоретическая ценность работы заключается в развитии теории математического моделирования процессов речеобразования и речевосприятия, численных расчетах обработки речевых сигналов с использованием сингулярного спектрального анализа.

Обоснование структуры работы В первой главе проводится анализ состояния проблемы оценки частоты основного тона речи, в котором рассматриваются существующие методы оценивания частоты основного тона речи с последующим обзором наиболее популярных алгоритмов RAPT, YIN, AC-P, AC-S, ANAL, CC, CEP, ESRPD, SHS, SHR, TEMPO, SWIPE'. Для получения собственных результатов проводится постановка эксперимента по оцениванию эффективности измерения частоты основного тона известными алгоритмами. В эксперименте рассматривается процент грубых ошибок (gross pitch errors - GPE), допускаемых в процессе оценивания ЧОТ речи. В качестве исходного материала для проведения акустического анализа выбираются базы данных: Disordered Voice Database (DVD); Keele Pitch Database (KPD); Paul Bagshaw’s Database (PBD). Далее рассматриваются различные модели вокализированного сегмента речевого сигнала. На основе гармонической модели осуществляется переход к сингулярной модели вокализированного сегмента речи, в которой рассматривается прямая и обратная задача. Осуществляется постановка главной задачи, где формулируются требования к модели сингулярного оценивания частоты основного тона речи.

Во второй главе осуществляется эвристическое построение концептуальной модели сингулярного оценивания частоты основного тона речи. Далее осуществляется переход к численному представлению модели. Рассматривается сингулярный спектральный анализ речевого сигнала, в котором прорабатывается вопрос о быстром численном методе спектрального разложения речи, далее проводятся оценки численных методов.

В третьей главе рассматривается реализация алгоритмов сингулярного оценивания частоты основного тона речевого сигнала в составе:

– генератора сингулярного спектра речевого сигнала;

– процедуры выбора квазигармонической составляющей, соответствующей частоте основного тона речи из спектра квазигармоник фонемного ряда.

В заключительной части главы полученные алгоритмы компонуются в главный алгоритм сингулярного оценивания частоты основного тона речевого сигнала.

В четвертой главе представлена программная реализация разработанной модели и алгоритмов. Приведена структура программного комплекса сингулярного оценивания частоты основного тона речи. Далее проводятся экспериментальные исследования с моделью, в которых даются оценки адекватности и достоверности модели. Обосновывается возможность применения комплекса в исследованиях, направленных на получение параметров основного тона речевого сигнала в режиме реального времени. Проводятся экспериментальные исследования с моделью, в результате которого даются оценки адекватности и достоверности.

ГЛАВА 1. Обзор существующих методов и алгоритмов оценивания частоты основного тона речи.

Обзор моделей вокализированного сегмента речевого сигнала. Постановка задачи В главе проводится анализ состояния проблемы оценивания частоты основного тона речевого сигнала. Рассматриваются существующие методы оценивания частоты основного тона речи, осуществляется обзор наиболее популярных алгоритмов и проводится их оценка. Далее рассматриваются модели вокализированного сегмента речевого сигнала, где на основе гармонической модели осуществляется переход к сингулярной модели вокализированного сегмента речи. Осуществляется постановка главной задачи, в которой выдвинуты требования к модели сингулярного оценивания частоты основного тона речи.

Загрузка...

Анализ состояния проблемы оценки частоты основного тона речи 1.1.

–  –  –

Известно, что участки вокализированной речи человека характеризуются энергией периодических колебаний голосовых складок. Голосовой источник может быть представлен в виде пульсирующего воздушного потока, где частота (период) повторения импульсов голосового источника носит название частоты (периода) основного тона. Основной тон (ОТ), являясь одним из основных параметров речевого сигнала, в существенной мере определяет структуру речевого сообщения [14]. Интонационный контур высказывания есть траектория изменения мелодии частоты ОТ. Просодика высказывания, одной из составляющих которой служит интонация, есть существенное отличие акустического сигнала речи от письменной речи. Частота (период) ОТ переносит существенное количество информации, содержащейся в речевом сигнале. Выделение частоты ОТ, с точки зрения представленной в нем информации, представляет самостоятельный интерес [14]. При этом необходимо определять, как относительно медленные изменения (мелодия) траектории частоты ОТ, так и быстрые ее изменения, моменты включения и отключения голосового источника. С другой стороны, и при построении систем анализа, синтеза, распознавания и сжатия речи, необходимо измерять частоту ОТ, которую используют как один из основных признаков, необходимых для описания речевого сигнала. При работе с реальным речевым сигналом оцениватель ЧОТ должен [14]:

1) быть шумозащищенным;

2) быть нечувствителен к линейным и нелинейным искажениям;

3) обеспечивать высокую точность оценивания частоты ОТ;

4) сохранять точность при больших пределах изменения частоты ОТ, при смене диктора, при смене условий передачи, при наличии микровариаций ЧОТ;

5) работать на сигнале непрерывной речи;

6) иметь адекватный детектор вокализации;

7) работать в реальном масштабе времени.

Для извлечения максимального количества информации, содержащейся в контуре сигнала ОТ, следует предъявить следующее дополнительное требование к системам выделения ЧОТ: оцениватель ЧОТ должен оценивать мгновенные значения периода (частоты) ОТ. Основные методы оценивания ЧОТ речевого сигнала можно рассматривать в следующей классификации [15]:

1. Методы, основанные на амплитудной селекции (амплитудные методы).

2. Корреляционные методы.

3. Методы, основанные на частотной селекции (спектральные методы):

— оконное преобразование Фурье;

— вейвлет-преобразования.

4. Методы, основанные на кепстральном анализе.

5. Методы на основе линейного предсказания.

Из данной классификации можно выделить два типа подходов: спектральные и временные. Спектральные обычно основаны на извлечении спектральных пиков. Временные используют, как правило, корреляционный подход. В последнее время было предложено несколько методов, которые по характеристикам превосходят традиционные. Какие-то методы обладают большей точностью, а какие-то большей устойчивостью к шумам. Рассмотрим принципы работы наиболее популярных методов из классификатора.

В методах, основанных на амплитудной селекции вычисляется расстояние между глобальными максимумами результаты которого можно принять за период ОТ. Необходимость подавления локальных ложных максимумов является проблемой алгоритмов амплитудной селекции [15, 16, 17]. Для решения данной проблемы обычно повышается порог срабатывания в схеме поиска максимумов. Однако при этом увеличивается вероятность пропуска истинного максимума. Пропуск и потеря максимума может привести к существенным искажениям звука в процессе синтезирования. Добавление второго канала амплитудной селекции, выделяющей положение минимумов речевого сигнала, увеличивает надежность определения периода ОТ. Тем не менее даже при относительно небольшом уровне шумов проявляются неустойчивость метода и существенное снижение точности определения ОТ. Достоинством данного метода является простота в реализации.

В основе корреляционных методов определения периода ОТ речевого сигнала заложены принципы оценки среднего значения периода пульсаций квазипериодической корреляционной функции [15, 18]. В частном случае вычисляется первый глобальный максимум корреляционной функции [15, 19]. Частота основного тона f0 рассчитывается в виде соотношения fd f0, N p 1 где fd – частота дискретизации;

N p1 – среднее число отсчетов корреляционной функции, через которое повторяются пульсации [20];

p – число глобальных максимумов корреляционной функции взятых для усредненной оценки N p1.

–  –  –

Данный подход обеспечивает существенно более высокую достоверность определения периода ОТ по сравнению с методами амплитудной селекции. При этом следует отметить значительную вычислительную сложность данного подхода. Корреляционные методы оценивания периода ОТ имеют общий недостаток, заключающийся в неустойчивой работе в случае, когда речевой сигнал модулирован по амплитуде. Энергия реальной, эмоционально окрашенной речи изменяется даже на квазистационарных участках, соответствующих одной фонеме. Так, например, в стандарте G.723 (регламентирующий способ сжатия речевого сигнала для видеоконференций) целевая функция модифицируется как N L( n, k ) ( S n i k S n k i ) 2, i 1

–  –  –

Данный подход позволяет получить достаточно точную оценку ОТ, которая плавно меняется во времени в соответствии с изменением речи.

Спектральный метод оценивания основан на том, что при вокализованном возбуждении речевого тракта в спектре сигнала присутствуют пики на частотах, кратных частоте ОТ. Если построить дискретное преобразование Фурье с достаточно малым шагом дискретизации по частоте, то можно попытаться в качестве оценки частоты ОТ использовать частоту, соответствующую максимальному значению энергии спектра. Поиск максимума обычно производится в интервале {70-80} – {350-500} Гц. Однако часто возникает ситуация, когда в указанной полосе лежит и вторая гармоника ОТ, иногда даже с большей энергией. В этом случае она будет ошибочно принята за оценку ОТ. Решение данной проблемы описано в [21]. Поэтому ищут не максимум спектра Xn(k), а некоторую функцию уплотнения спектра.

–  –  –

где индекс n указывает на то, что и спектр Xn(k) и функция Pn(k) вычислены в момент времени n. Учитывая то, что логарифм монотонно возрастает в области допустимых значений, целевая функция принимает вид

–  –  –

Эта функция представляет собой сумму R сжатых по частоте в r раз логарифмов спектра мощности. Суть идеи состоит в том, что для истинной частоты основного тона вторая гармоника второго слагаемого сложится с первой гармоникой первого слагаемого и усилит ее. Аналогично для третьего слагаемого и т.

д. В результате для вокализованного звука будет иметь место ярко выраженный ~ пик функции Pn (k ) на частоте ОТ. Для невокализованного звука суммирование будет иметь хаотический характер.

В общем случае оценка значений спектра является несостоятельной и может иметь большие погрешности. Для уменьшения ошибки оценки спектральных составляющих, например, нормированной спектральной плотности мощности, применяют методику спектральных окон. Выбор спектрального окна (весовой функции) при анализе определяется в результате компромисса между разрешающими способностями по частоте и во времени [15, 17, 21, 22].

Однако применение нелинейного преобразования спектра и окон может вносить большие смещения, что существенно снижает точность оценки.

Метод оценки ЧОТ на основе вейвлет преобразования относительно новый и развивающийся метод, базирующийся на применении непрерывного или дискретного вейвлет анализа. Положительная сторона данного метода для генерированного эталонного четырехгармонического сигнала относительная погрешность оценки ЧОТ и формантных частот не превышала 0,38% [15, 23]. Недостатком данного метода является:

— необходимость корректировки окна преобразования под каждую оцениваемую частоту;

— большие вычислительные затраты (особенно для систем реального времени).

Кепстральный метод оценивания ЧОТ состоит в вычислении и анализе кепстра – обратного преобразования Фурье комплексного логарифма спектра мощности речевого сигнала [21, 24-27]. Для увеличения скорости вычисления ЧОТ в данном методе преобразование Фурье выполняют с помощью алгоритма быстрого преобразования [28]. Длительность анализируемого речевого кадра не должна превышать длительности, по крайней мере, двух-трех наиболее длинных для данной фонограммы периодов основного тона и быть кратной степени двух, что составляет обычно 512 отсчетов для низких мужских голосов и 256 для женских и высоких мужских голосов (при частоте дискретизации, равной 10кГц). В то же время, чем больше окно, тем дольше вычисляется основной тон и тем хуже отслеживаются быстрые изменения частоты ОТ. Для снятия эффекта наложения частот используют окно Xанна [29]. Наличие выраженного максимума в кепстре в диапазоне от 2мс до 20мс очень точно указывает на то, что данный кадр является вокализованным, а положение максимума определяет период анализируемого сигнала. Алгоритм вычисления периода основного тона кепстральным методом заключается в следующем. Длина кадра, анализируемого с помощью кепстра, обычно равна 512 отсчетам для мужских голосов и 256 для женских голосов. Сдвиг от кадра к кадру обычно задают равным 1/16-1/4 длины кадра анализа. Для оптимизации выделения ОТ, особенно на зашумленных или хриплых сигналах, можно задать значения границ полосы частот спектра, по которой вычисляют кепстр сигнала и на его основе - значение периода ОТ. Для каждого анализируемого кадра полученный кепстр исследуется с целью отыскания пика в области возможных значений ОТ. Если пик в кепстре превышает порог, то кадр классифицируется как вокализованный, а положение пика дает оценку периода основного тона [30]. Однако алгоритмы использующие данный метод имеют ряд существенных недостатков:

— необходимость применения дополнительной методики вычисления порога для оценки периода ОТ в области возможных значений;

— невозможность работы в реальном масштабе времени;

— необходимость применения временных окон и операций сглаживания;

— низкая точность оценки при сильной узкополосности гармоники основного тона [21].

Алгоритмы оценки ЧОТ основанные на методе линейного предсказания, используют принцип обратной фильтрации (обратный линейный фильтр). В основе данного метода используется приближенная модель речеобразования, в

–  –  –

ния выше. При приближении частоты повторения в обратном фильтре к частоте ОТ происходит все более и более сильное выравнивание спектра. Таким образом, трудность заключается в постоянном расчете спектра речевого сигнала при подстройке частоты повторения в обратном фильтре A(z). Метод дает достаточно удовлетворительные оценки, пока спектр выравнивается достаточно хорошо, однако появляется новая задача определения степени равномерности спектра после обратной фильтрации, а при частотах ОТ выше 200Гц данный метод оценки приводит к плохим результатам [19].

Подводя итог относительно рассмотренных методов заключим, что корреляционная функция является Фурье-преобразованием энергетического спектра, и положения ее пиков соответствуют расстояниям между равномерно расположенными гармониками спектра. В кепстральном анализе в место энергетического спектра используется логарифм амплитудного спектра.

Таким образом, уменьшается влияние высокоамплитудных участков спектра. Это особенно важно для области частот первой форманты, которая часто отрицательно влияет на качество работы корреляционного анализа. Схожие эффекты "спектральной очистки" могут быть получены с помощью обратной фильтрации с предсказанием или центрального клиппирования [21], либо с помощью разделения сигнала на несколько частотных полос, и вычислением корреляционной функции в каждой полосе с последующей нормировкой и суммированием [31]. Использование моделей слуха на основе корреляционных методов на сегодняшний день является одним из самых популярных подходов к объяснению восприятия основного тона [32, 33].

На основе представленных методов оценивания ЧОТ разработано достаточно много алгоритмов как отечественных, так и зарубежных аналогов. Ниже рассмотрим наиболее популярные алгоритмы и попробуем сформулировать некоторую оценку.

Обзор отечественных алгоритмов оценивания ЧОТ 1.1.2.

Известны различные способы оценивания ЧОТ. Некоторые из них используются в современной технике, предназначенной для импульсного кодирования телефонных переговоров. Технология выделения ЧОТ обычно сопровождается процессом фильтрации с частотно-зависимым затуханием и фазовой коррекцией в полосе пропускания. Фильтровые методы выделения основного тона, используемые в отечественной аппаратуре, вносят значительные замедления для выделяемого сигнала основного тона, искажают истинную величину периода основного тона в динамике речи.

Так, например, известен способ оценивания частоты основного тона [34], основанный на преобразовании речевых колебаний в импульсную последовательность. Каждый импульс соответствует переходу через ноль речевого колебания (берется однополярный переход). Используется свойство, что на периоде основного тона последовательности межимпульсных интервалов повторяются.

Однако данный способ обладает существенным недостатком, который связан с пропусками интервалов, обладающих основным тоном, при смене одной фонемы другой. Это происходит благодаря тому, что при смене одной звучащей фонемы другой между двумя соседними периодами основного тона изменения межимпульсных интервалов становятся значительными.

Известен также способ оценивания ЧОТ с помощью узкополосного фильтра [35], следящего за изменением частоты первой гармоники речевого сигнала, причем ширина полосы итерационно подстраивается под среднюю частоту основного тона, рассчитываемую на основании выходной функции этого фильтра и передаваемую на фильтр благодаря обратной связи. Данный способ проявляет хорошую работоспособность при условии, что фильтр подстраивается под диктора в течение нескольких минут. Однако способ не пригоден для выявления частоты основного тона в коротких сообщениях, длительность которых составляет несколько секунд.

Известен также способ оценивания частоты основного тона с использованием трехканального метода обработки речевого сигнала [36]. В первом канале проводится амплитудная селекция по схеме Голда, во втором канале используется аппроксимация первой гармоники основного тона экспоненциальной функцией, и в третьем канале проводится вычисление корреляционной функции по схеме Медана. Считается, что частота основного тона найдена, если разность между полученными значениями оценок частоты основного тона для различных каналов не превышает заданную величину. Недостаток данного способа проявляется в невозможности обнаружения речи на фоне стационарных и нестационарных шумов, обладающих сплошным спектром, без априорных знаний о статистических свойствах шума, а также невозможность формирования вектора признаков сигналов для систем распознавания речи, идентификации дикторов и идентификации языка, устойчивого к изменению статистических свойств шума, на фоне которого проводится распознавание или идентификация.

Также известна система оценивания ЧОТ, представленная в патенте [37].

В ее состав входят последовательно соединенные блок вычисления спектра Фурье, интегратор, вычислитель значений определителя автокорреляционной матрицы, блок проверки синхронности и блок аппроксимации подпоследовательностей квадратичной функцией, а также выделитель ОТ по схеме Голда и блок выделения ОТ с полосовым фильтром, включенные между выходом указанного вычислителя и соответствующими входами блока проверки синхронности. Принцип действия данной системы основан на разложении речевого сигнала в последовательность спектров Фурье, нахождении абсолютного максимума, вычислении среднего значения аргумента последовательности полученных максимумов, оценке средней ЧОТ исследуемого речевого сигнала, амплитудной селекции сигналов, вычислении значений определителя автокорреляционной матрицы и фильтрации этих значений. Недостатком данного способа является низкая точность, которая связана с сильной зависимостью схемы в целом от точности каждого алгоритма, входящего в его состав, например, в данном изобретении используется блок дискретного преобразования Фурье, который не лишен проблем, связанных с эффектом Гиббса и ложными результатами при анализе не стационарных временных рядов. А амплитудная селекция экстремальных значений по методу Голда требует для выделения ОТ громоздкой технической реализации для обработки ряда статистических параметров, особенно для систем реального времени.

–  –  –

В настоящее время популярны следующие алгоритмы: RAPT [38], YIN [39], SWIPE' [40], SHS [41] и т.д. Рассмотрим известные из них:

Robust Algorithm for Pitch Tracking (RAPT) – широко распространенный алгоритм с хорошо изученными преимуществами и недостатками, имеет относительно низкую алгоритмическую задержку, низкую вычислительную сложность и обеспечивает хорошую устойчивость к ошибкам в условиях зашумленности. Практические эксперименты показывают, что RAPT в большинстве случаев более других алгоритмов устойчив к влиянию частотных модуляций ОТ. В основе данного алгоритма используется нормированная кросскорреляционная функция (НККФ) в качестве основной функции генерации кандидатов ЧОТ речи. Также имеется подсистема динамического программирования для уточнения оценки ЧОТ. Функция НККФ позволяет оценить степень периодичности сигнала в зависимости от задержки сигнала в отсчетах. В RAPT предполагается, что анализируемый речевой сигнал обладает следующими характерными свойствами [38, 42]:

— для невокализованной речи значения НККФ (за исключением нулевой задержки) значительно ниже единицы;

— при переходе от невокализованного фрейма к вокализованному, амплитуда сигнала увеличивается, и, наоборот, при переходе от вокализованного к невокализованному уменьшается;

— когда имеется несколько локальных максимумов НККФ близких к единице, то выбирается тот, который соответствует наименьшему периоду;

— кратковременный спектр вокализованных и невокализованных фреймов речи обычно существенно различны;

— максимумы НККФ смежных фреймов расположены близко друг к другу, поскольку ЧОТ изменяется медленно;

— изменение состояния вокализованности происходит редко;

— ЧОТ иногда может резко увеличиться или уменьшиться;

— локальный максимум НККФ, соответствующий действительному периоду ОТ речи (кроме нулевой задержки), является наибольшим и близким к единице.

Функция НККФ i;k (для задержки k и анализируемого кадра i) для входного сигнала определяется как:

–  –  –

где S – входной сигнал;

n – число отсчетов в каждом окне анализа;

w – шаг окна анализа.

Вычисление функции НККФ достаточно затратная операция, поэтому в RAPT сначала осуществляется анализ кадров с пониженной частотой дискретизации. Основные шаги алгоритма осуществляются по следующему принципу [38, 42]:

1. Создаются две версии анализируемого фрагмента речи: одна с исходной частотой дискретизации, другая с пониженной.

2. Вычисляется НККФ для всех фреймов речевого сигнала с пониженной частотой дискретизации и всех задержек из допустимого диапазона периода ОТ.

3. Осуществляется поиск и сохранение локальных максимумов полученных значений НККФ.

4. Вычисляется НККФ для всех фреймов сигнала с исходной частотой дискретизации в окрестностях локальных максимумов, найденных на предыдущем шаге.

5. Выполняется поиск и сохранение локальных максимумов полученных значений НККФ с высоким разрешением дискретизации.

6. Каждый из найденных максимумов является кандидатом периода ОТ для соответствующего речевого фрейма.

7. С помощью динамического программирования осуществляется поиск контура ЧОТ найденных кандидатов периода [43].

Для сравнительных оценок оригинальная версия алгоритма RAPT реализован в пакете Voicebox [44].

YIN pitch tracker алгоритм [39], использующий функцию "разности" (ФР), полученную на основе функции автокорреляции. ФР используется в генераторе кандидатов ЧОТ в связке с определенным числом шагов оптимизации.

Оценивание ЧОТ данным алгоритмом осуществляется по следующему принципу:

1. В момент, когда автокорреляционная функция стремится максимизировать результат произведения между формой волны и отложенным ее дубликатом, ФР сводит к минимуму разницу между формой волны и отложенным ее дубликатом. Иными словами, предполагается, что разница между периодическим сигналом xt периода T и его смещенной во времени версией xt+T равна нулю, т. е.

<

–  –  –

Такое допущение становится верным после возведения в квадрат и усреднение переменных на интервале анализа. Период ОТ можно вычислить, если найти в анализируемом интервале значение величины, в результате ФР,

–  –  –

будет равна нулю. Т.е. в случае идеального периодичного сигнала эта функция имеет нули на смещениях, кратных периоду, а в случае неидеальной периодичности близка к нулю.

2. На основе функции разности проводится нормирование накопленного среднего значения. Накопленное среднее значение нормализует функцию разности, чтобы обеспечить квазипериодичность ОТ, таким образом алгоритм YIN нормируется по среднему накопленному значению и устанавливает величину 1 для = 0 как если 0 d't () d t () / [(1 / ) j 1 d t ( j )] иначе.

Данная функция опускается ниже единицы только когда значение dt() меньше среднего значения dt() на интервале от 1 до. Функция не имеет "провала" на нулевом смещении, а ложные минимумы, порождаемые первой формантой, выражены слабее. За счет введения d’t() уменьшается число завышенных оценок ЧОТ и снимается ограничение на максимальную искомую частоту.

3. На последнем этапе оценивается абсолютный порог, проводится параболическая интерполяция и поиск локальных значений – эти три последних шага обеспечивают замену абсолютного порога на наименьшую величину, которая принималась ранее. Параболическая интерполяция используется для корректирования местоположения пика и поиска начальных маркеров ЧОТ для дальнейшего уточнения расчетов. Данный алгоритм является одним из наиболее точных технологий оценивания ЧОТ, но для сигналов с хорошим отношением сигнал-шум.

Sawtooth Waveform Inspired Pitch Estimator (SWIPE') – это алгоритм вычисления ЧОТ на основе корреляции речевого сигнала с пилообразным импульсом (SWIPE), был разработан Камачо и Харрисом (Camacho A., Harris J.G.) [40]. Основой послужил существующий алгоритм SWIPE. Принцип работы данного алгоритма заключается в измерении среднего расстояния между спадами и пиками в спектре в гармонических колебаниях ОТ (Average Peak-toValley Distance - APVD). Например, если сигнал является периодическим с ЧОТ f0, то его спектр должен содержать пики на кратных частотах f0 и впадины между ними. Если каждый пик находится в окружении двух впадин, то среднее расстояние от пика до впадины для k-го пика определяется как (APVD)

–  –  –

На базе данного алгоритма разработана его продвинутая модификация – SWIPE', усовершенствованная в 2007-м году Артуром Камачо [45]. Оригинальная реализация данного алгоритма осуществлена для среды Matlab в качестве функции pitchStrengthOneCandidate. На сегодняшний день SWIPE' является практически лидером существующих алгоритмов оценивания ЧОТ. Грубые оценки ЧОТ для данного алгоритма показывают нулевой результат при соотношении сигнал-шум 5-25dB, в условиях модуляции ОТ в пределах 2Гц/мс.

AC-P алгоритм [46], вычисляющий автокорреляцию сигнала c дальнейшим делением на автокорреляцию окна анализируемого речевого сигнала. Далее в подсистеме постобработки, осуществляется отбор кандидатов ЧОТ. Алгоритм реализован в качестве функции ac в программе Praat [47];

AC-S алгоритм, основанный на автокорреляции сигнала кубической формы. Алгоритм реализован в системе SFS (Speech Filing System) [48] в качестве функции fxac [49];

ANAL алгоритм [50], использующий автокорреляционную функцию и динамическое программирование [43] для отбора кандидатов ЧОТ. Алгоритм реализован в системе SFS [48] в качестве функции fxanal [51];

CC алгоритм [52], использующий кросскорреляционные методы для оценки ЧОТ речи и подсистему постобработки для отбора кандидатов ЧОТ.

Алгоритм реализован в качестве функции cc в программе Praat [47];

CEP алгоритм, основанный на вычисление кепстра речевого сигнала.

Алгоритм реализован в системе SFS [48] в качестве функции fxcep [53];

ESRPD алгоритм [54, 55], использующий нормированную кросскорреляционную функцию и систему постобработки для отбора кандидатов ЧОТ.

Алгоритм реализован в системе FSFS (Festival Speech Filing System) в качестве функции pda [56];

SHS алгоритм [41], использующий принцип субгармонического суммирования. Алгоритм реализован в качестве функции shs в программе Praat [47];

SHR алгоритм [57], использующий принцип субгармонического отношения к гармоническому. Алгоритм реализован в Matlab как “Pitch Determination Algorithm” в виде функции shrp;

TEMPO [58] алгоритм, использующий систему различных фильтров для отыскания квазигармоники с ЧОТ. Алгоритм реализован в высококачественном вокодере STRAIGHT в качестве функции exstraightsource.

Данные алгоритмы можно рассматривать как некоторое обобщение (рис.

1.1) [42, 59-61]: 1 – модуль предобработки или приведения сигнала к требуемым характеристикам, 2 – генератор кандидатов действительного искомого периода ОТ, 3 – модуль постобработки или выбора наилучшего кандидата с последующим уточнением значения ЧОТ. Как можно заметить, в подавляющем числе рассматриваемых алгоритмов используется корреляционный аппарат, который обычно реализован в генераторе кандидатов ОТ (рис. 1.1). Основные принципы оценивания ЧОТ, известных алгоритмов, можно рассматривать по следующей схеме (рис. 1.2) [45]:

1) разбиение речевого сигнала на окна;

2) оценивание присутствующего спектра в окнах (оконным преобразованием Фурье (short-time Fourier transform - STFT), корреляцией (Correlation), вейвлет преобразованием (wavelet transform) и т.д.);

3) агрегация спектра (для каждого полученного кандидата ЧОТ, вычисляется интеграл (integral transform -IT));

4) выбор кандидат ЧОТ с наибольшим рейтингом агрегации.

–  –  –

Рассмотрим процент грубых ошибок (gross pitch errors - GPE), появляющихся в процессе оценивания частоты основного тона, для известных алгоритмов RAPT, YIN, AC-P, AC-S, ANAL, CC, CEP, ESRPD, SHS, SHR, TEMPO, SWIPE'. В данном случае, величина GPE показывает отношение количества анализируемых фреймов с отклонением полученной оценки ЧОТ более чем на ±20% от настоящего значения ЧОТ к общему числу вокализированных фреймов [42] N GPE GPE(%) 100, NV где NGPE – число фреймов с отклонением полученной оценки более чем на ±20% от настоящего значения основного тона;

NV – общее число вокализированных фреймов.

На первый взгляд 20%-я погрешность кажется слишком большой, но, учитывая, что большинство ошибок, допущенных алгоритмами при оценивании

ЧОТ, варьируются в пределах октавы, то выбор такой погрешности можно считать разумным [42, 45]. В качестве исходного материала использовались следующие речевые базы данных:

— Disordered Voice Database - DVD [62], база содержит 657 несортированных (как мужских, так и женских) образцов вокализированных сегментов речи;

— Keele Pitch Database - KPD [63], база содержит около 8 минут речи, произнесенной пятью мужчинами и пятью женщинами. Контрольные оценочные значения частоты основного тона получены с помощью ларинографа;

— Paul Bagshaw’s Database - PBD [64], база содержит около 8 минут речи, произнесенные одним мужчиной и одной женщиной. Контрольные оценки ЧОТ получены с помощью ларинографа.



Pages:   || 2 | 3 | 4 |
 
Похожие работы:

«Баканова Светлана Александровна МОДЕЛИРОВАНИЕ ПРОЦЕССОВ РАСПРОСТРАНЕНИЯ ЗНАНИЙ В ВЫСОКОТЕХНОЛОГИЧНЫХ КОМПАНИЯХ Специальность 08.00.13 – Математические и инструментальные методы экономики ДИССЕРТАЦИЯ на соискание ученой степени кандидата экономических наук Научный руководитель: доктор экономических наук, профессор Силкина Галина...»

«Фокин Г.А. Методология создания автономных турбинных источников электрической энергии, использующих энергию сжатого природного газа для собственных нужд газотранспортной системы России Специальность 05.04.02 Турбомашины и комбинированные турбоустановки ДИССЕРТАЦИЯ НА СОИСКАНИЕ УЧЕНОЙ СТЕПЕНИ ДОКТОРА ТЕХНИЧЕСКИХ НАУК Научный...»

«ФИШЕВА АНАСТАСИЯ АЛЕКСАНДРОВНА ОБЩЕЕ ОБРАЗОВАНИЕ ВЗРОСЛЫХ НА ТЕРРИТОРИИ РСФСР В 1930-1950-е гг. Специальность 07.00.02 – Отечественная история ДИССЕРТАЦИЯ на соискание ученой степени кандидата исторических наук Научный руководитель: доктор исторических наук, профессор Ульянова С.Б. Санкт-Петербург 2014 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ...»

«Субботин Михаил Юрьевич ВЛИЯНИЕ ФИЗИКО-МЕХАНИЧЕСКИХ СВОЙСТВ РУДНЫХ КОНЦЕНТРАТОВ НА КОНСТРУКТИВНЫЕ ПАРАМЕТРЫ ВНУТРЕННИХ УСТРОЙСТВ БАРАБАННЫХ СУШИЛОК Специальность 25.00.13 «Обогащение полезных ископаемых» ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук...»

«НЕФЕДОВ ДЕНИС ГЕННАДЬЕВИЧ МАТЕМАТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО РАЗМЕЩЕНИЯ ЭЛЕМЕНТОВ РАСПРЕДЕЛЕННОЙ ПРОИЗВОДСТВЕННОЙ СТРУКТУРЫ Диссертация на соискание ученой степени кандидата технических наук Специальность: 05.13.18 – Математическое...»

«Носков Евгений Игоревич Конструкция и методика расчета пневмоприводного вакуумного насоса 05.04.13 – Гидравлические машины и гидропневмоагрегаты Диссертация на соискание ученой степени кандидата технических наук Научный руководитель: Д.т.н., профессор Донской А.С. Санкт-Петербург -2015 Оглавление Введение 5 Глава 1. Обзор...»

«СЮНЯЕВА Диана Анатольевна СТРУКТУРИЗАЦИЯ ПРОЦЕССА УПРАВЛЕНИЯ ЭЛЕКТРОЭНЕРГЕТИЧЕСКОЙ КОМПАНИИ (ПРИНЦИПЫ ПОСТРОЕНИЯ И МЕТОДЫ ОЦЕНКИ) Специальность 08.00.05 – экономика и управление народным хозяйством (экономика, организация и управление предприятиями, отраслями, комплексами: промышленность) Диссертация на соискание ученой степени...»

«Фи Хонг Тхинь ОЦЕНКА И ПРОГНОЗ ОСЕДАНИЯ ЗЕМНОЙ ПОВЕРХНОСТИ В РЕЗУЛЬТАТЕ ИЗВЛЕЧЕНИЯ ПОДЗЕМНЫХ ВОД НА ТЕРРИТОРИИ Г. ХАНОЙ (ВЬЕТНАМ) 25.00.08 – «Инженерная геология, мерзлотоведение и грунтоведение» Диссертация на соискание ученой степени кандидата геолого-минералогических наук Научный руководитель: доктор...»

«Киселева Светлана Петровна ТЕОРИЯ ЭКОЛОГО-ОРИЕНТИРОВАННОГО ИННОВАЦИОННОГО РАЗВИТИЯ Специальность: 08.00.05 Экономика и управление народным хозяйством (Экономика природопользования) Диссертация на соискание ученой степени доктора экономических наук Научный консультант: Заслуженный деятель науки РФ, доктор технических наук, профессор...»

«КОЗИНЕЦ ГАЛИНА ЛЕОНИДОВНА МЕТОДОЛОГИЯ ОБОСНОВАНИЯ ПРОЕКТНЫХ ПАРАМЕТРОВ ГИДРОАГРЕГАТНЫХ БЛОКОВ ВЫСОКОНАПОРНЫХ ГЭС Специальность 05.14.08 Энергоустановки на основе возобновляемых видов энергии Диссертация на соискание ученой степени доктора технических наук Научный...»

«ВЕРВЕКИН АНДРЕЙ ВАЛЕРЬЕВИЧ УПРАВЛЕНИЕ ЭФФЕКТИВНОЙ ОТРАБОТКОЙ ВИНТОВЫХ ЗАБОЙНЫХ ДВИГАТЕЛЕЙ ПРИ БУРЕНИИ НЕФТЯНЫХ И ГАЗОВЫХ СКВАЖИН Специальность 25.00.15 – Технология бурения и освоения скважин Диссертация на соискание ученой степени кандидата технических...»

«ПАВЛОВ НИКИТА СЕРГЕЕВИЧ ТЕХНОЛОГИИ ГЕОДЕЗИЧЕСКОГО ОБЕСПЕЧЕНИЯ ОБСЛЕДОВАНИЙ ПОДВОДНЫХ ПЕРЕХОДОВ МАГИСТРАЛЬНЫХ ГАЗОПРОВОДОВ Специальность 25.00.32 – Геодезия ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук Научный руководитель: доктор технических...»

«Антонова Наталья Михайловна РАЗРАБОТКА КОМПОЗИЦИОННЫХ МАТЕРИАЛОВ НА ОСНОВЕ ПОЛИМЕРА NA–КМЦ С МЕТАЛЛИЧЕСКИМИ ПОРОШКОВЫМИ НАПОЛНИТЕЛЯМИ ДЛЯ ФОРМИРОВАНИЯ ФУНКЦИОНАЛЬНЫХ ПОКРЫТИЙ И ПОРИСТЫХ ПЛЕНОК Специальность 05.16.06 –Порошковая металлургия и...»

«ФАМ ХОАИ АН МОДЕРНИЗАЦИЯ ГАЗОПАРОВЫХ КОМБИНИРОВАННЫХ УСТАНОВОК ВЬЕТНАМА С ЦЕЛЬЮ ПОВЫШЕНИЯ ИХ ЭКОНОМИЧНОСТИ И МОЩНОСТИ ЗА СЧЕТ ПРИМЕНЕНИЯ ВЫПУСКАЕМЫХ И УСОВЕРШЕНСТВОВАННЫХ РОССИЙСКИХ ПАРОВЫХ ТУРБИН Специальность – 05.04.12 «Турбомашины и комбинированные турбоустановки» ДИССЕРТАЦИЯ на соискание ученой степени кандидата...»

«АБДУЛЛАЕВ МАКСИМ ДМИТРИЕВИЧ ОБОСНОВАНИЕ МЕТОДИКИ ОПРЕДЕЛЕНИЯ ВЫСОТЫ УСТУПА ПРИ ПРОЕКТИРОВАНИИ ОТКРЫТОЙ РАЗРАБОТКИ КРУТОПАДАЮЩИХ МЕСТОРОЖДЕНИЙ Специальность 25.00.21 – Теоретические основы проектирования горнотехнических систем Диссертация на соискание ученой степени...»

«БЕРЕЖНАЯ ОКСАНА ВИТАЛЬЕВНА РАЗРАБОТКА ТЕХНОЛОГИИ ПОЛУЧЕНИЯ ПРОРОСТКОВ ЗЕРНА ПШЕНИЦЫ ПРИ ПРОИЗВОДСТВЕ ХЛЕБОПЕКАРНОЙ И КУЛИНАРНОЙ ПРОДУКЦИИ Специальность 05.18.01 – Технология обработки, хранения и переработки злаковых, бобовых культур, крупяных продуктов, плодоовощной продукции и виноградарства ДИССЕРТАЦИЯ на...»

«НГУЕН ВАН ТЫ МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ СТЕРЖНЕВЫХ ЖЕЛЕЗОБЕТОННЫХ КОНСТРУКЦИЙ Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ Диссертация на соискание ученой степени кандидата технических наук Научный руководитель: Доктор технических наук, Доцент Т.Л. Дмитриева Иркутск 2015 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ.. ГЛАВА 1. СОВРЕМЕННОЕ СОСТОЯНИЕ...»

«МНОГОМОДОВЫЕ ПРЯМОУГОЛЬНЫЕ ДИЭЛЕКТРИЧЕСКИЕ ВОЛНОВОДЫ И РЕЗОНАТОРЫ КВЧ ДИАПАЗОНА Диссертация на соискание ученой степени кандидата технических наук по специальности 05.12.04 Радиотехника, в том числе системы и устройства телевидения Руководитель к.т.н., доцент Крутских В.В. АННОТАЦИЯ Данная работа содержит 154 страниц, 84 иллюстраций, 15 таблиц. Данная работа посвящена исследованию многомодовых прямоугольных диэлектрических волноводов (МПДВ),...»

«Рахматулин Ильдар Рафикович РАЗРАБОТКА КОМПЛЕКСНОЙ ЭНЕРГОЭФФЕКТИВНОЙ СОЛНЕЧНОЙ ОПРЕСНИТЕЛЬНОЙ УСТАНОВКИ С СИСТЕМОЙ СЛЕЖЕНИЯ ЗА СОЛНЦЕМ Специальность 05.09.03 – Электротехнические комплексы и системы ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук Научный руководитель – доктор технических наук, профессор Кирпичникова И.М Челябинск – 2015 СОДЕРЖАНИЕ ВВЕДЕНИЕ...5 ГЛАВА 1 СОСТОЯНИЕ ВОПРОСА И ЗАДАЧИ ИССЛЕДОВАНИЯ.11 1.1...»

«Субботин Михаил Юрьевич ВЛИЯНИЕ ФИЗИКО-МЕХАНИЧЕСКИХ СВОЙСТВ РУДНЫХ КОНЦЕНТРАТОВ НА КОНСТРУКТИВНЫЕ ПАРАМЕТРЫ ВНУТРЕННИХ УСТРОЙСТВ БАРАБАННЫХ СУШИЛОК Специальность 25.00.13 «Обогащение полезных ископаемых» ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук...»









 
2016 www.konf.x-pdf.ru - «Бесплатная электронная библиотека - Авторефераты, диссертации, конференции»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.