Мегаобучалка Главная | О нас | Обратная связь


CELP (Code Excited Linear Prediction)



2019-07-04 342 Обсуждений (0)
CELP (Code Excited Linear Prediction) 0.00 из 5.00 0 оценок




 

Метод кодирования CELP основан на линейной авторегрессионной моде­ли процесса формирования и воспри­ятия речи и входит в группу мето­дов анализа через синтез, реализую­щих современные и эффективные ал­горитмы информационного сжатия ре­чевых сигналов. Алгоритмы данного класса занимают промежуточное поло­жение между кодерами формы сигна­ла, в которых сохраняется форма коле­бания речевого сигнала в процессе его дискретизации и квантования, и пара­метрическими вокодерами, основанны­ми на процедурах оценки и кодирова­ния небольшого числа параметров ре­чи, объединяя преимущества каждого из них.

Линейная авторегрессионная мо­дель процесса формирования речевых сигналов с локально постоянными на интервалах 10. . .30 мс параметрами получила в настоящее время наиболь­шее распространение. Для этой моде­ли

                                                          (3.5)

где М — порядок модели; – последовательность отсчетов речево­го сигнала; – коэффициенты линейного предсказания, характери­зующие свойства голосового тракта; – порождающая последователь­ность или сигнал возбуждения голосо­вого тракта.

Авторегрессионная модель речево­го сигнала описывает его с достаточ­но высокой степенью точности и по­зволяет применять развитый матема­тический аппарат линейного предска­зания. При этом обеспечивается более высокое качество декодированной ре­чи, устойчивость к входному акустиче­скому шуму и ошибкам в канале свя­зи по сравнению с системами с иными принципами кодирования.

В рамках данной модели наибо­лее перспективными методами кодиро­вания считаются методы «анализа че­рез синтез» с использованием многоимпульсного возбуждения. Новизна мно­гоимпульсного возбуждения заключа­ется в том, что в сигнале остатка ли­нейного предсказания выбираются та­кие его значения, которые наиболее важны для повышения качества синте­зированной речи. При этом использу­емая в процедуре анализа через син­тез схема кодирования, помимо учета ошибок квантования, включает крите­рии субъективной оценки качества ре­чевого сигнала, что обеспечивает есте­ственное звучание синтезированной ре­чи.

При многоимпульсном возбужде­нии сигнал остатка линейного предска­зания представляется в виде последо­вательности импульсов с неравномер­но распределенными интервалами и с различными амплитудами (около 8-10 импульсов за 10 мс). Амплитуды и по­ложение этих импульсов определяют­ся на покадровой основе (кадр за ка­дром). Основным преимуществом мно­гоимпульсного возбуждения является то, что она определяется для любого речевого сегмента и при этом не тре­буется знаний ни о вокализованности данного сегмента, ни о периоде основ­ного тона.

Методы анализа через синтез ис­пользуют синтезатор (декодер) ре­чевого сигнала как составную часть устройства кодирования. При этом задача анализа сводится к процедуре оценки передаваемых в канал связи па­раметров речи, проводимой в соответ­ствии с некоторым критерием рассо­гласования между исходным и декоди­рованным сигналами. Для учета спе­цифики слухового восприятия в каче­стве критерия рассогласования обычно используется взвешенная по частоте квадратическая ошибка

                                                        (3.6)

где  и  – преобразование Фу­рье исходного и синтезированного ре­чевых сигналов; – весовая функ­ция. Принимая во внимание важ­ность для восприятия речи не только формант, но и межформантных обла­стей, для алгоритмов анализа речи че­рез синтез в качестве эталонной была предложена весовая функция следую­щего вида:

                                                                     (3.7)

где  – передаточная харак­теристика синтезирующего фильтра; γ – параметр, регулирующий энер­гию ошибки или шум квантования. Фактически при таком окне взвешива­ния подчеркивается ошибка в межфор­мантных областях и тем самым обеспе­чивается более равномерное по часто­те распределение отношения мощности полезного сигнала к мощности ошибки кодирования.

В алгоритмах кодирования с «анализом через синтез» повышение эффективности информационного уплотнения речевых сигналов производится, преимущественно, за счет сокращения избыточности последовательности x(h), которая осуществляет возбуждение синтезирующего фильтра  линейного предсказания, формирующего огибающую сигнала, с коэффициентом передачи

                                                              (3.8)

Для этой цели применяется также дополнительный фильтр с характеристикой

                                                                      (3.9)

с коэффициентом предсказания  и задержкой на период основного тона T. Фильтр выполняет функции генератора квазипериодических колебаний голосовых связок при произношении вокализованных звуков.

В зависимости от способа описания сигнала x(h), поступающего на вход фильтра (3.9), можно выделить алгоритмы кодирования:

с возбуждением прореженной последовательности импульсов — MPLP (Multi Pulses Linear Prediction);

с самовозбуждением — SELP (Self Excited Linear Prediction);

с кодовым возбуждением — CELP

Экспериментально установлено, что кодовое возбуждение обеспечивает наиболее высокое качество кодирования речевого сигнала, в том числе и при наличии входных акустических помех.

CELP наиболее эффективно применяется при передаче речевого сиг­ала в диапазоне скоростей от 4 до 6 кбит/с.

По существу, в алгоритме CELP производится векторное квантование последовательности , т.е. позиции выборок и их амплитуды в сигнале многоимпульсного возбуждения оптимизируются одновременно. При том отрезок (сегмент) сигнала возбу­ждения выбирается из предварительно формированной постоянной совокупности – кодовой книги, содержащей достаточно большое количество реализаций, например, некоррелированного гауссовского шума. Выбранная реализация усиливается и подается на вход цепочки фильтров (3.9) и (3.8).

Поиск оптимальных значений  и Т синтезатора основного тона, коэф­фициента усиления и номера элемента кодовой книги осуществляется посредством «анализа через синтез». В канал связи передаются номер (индекс) элемента кодовой книги с соответству­ющим коэффициентом усиления, параметры синтезатора основного тона, а также коэффициенты линейного предсказания, характеризующие состояние голосового тракта.

Являясь одной из самых распро­страненных, схема с линейным пред­сказанием и возбуждением от кода CELP является лучшей схемой AbS-LPC для низких скоростей. В CELP имеется линейный фильтр с изменяю­щимися во времени параметрами для выделения грубой и точной спектраль­ной информации. Возбуждение выпол­няется путем перебора всех векто­ров из возбуждающей кодовой кни­ги. Векторная последовательность, обеспечивающая минимальную взве­шенную ошибку, считается оптималь­ным возбуждением. Процедура AbS в CELP требует больших вычислитель­ных ресурсов, а основная кодовая кни­га является результатом очень боль­шой исследовательской работы. Хо­тя CELP является сложным методом, он способен синтезировать речь с высо­ким качеством даже на низких скоро­стях. Вариант кодирования CELP вы­бран для многих систем голосовой свя­зи.

Хотя CELP, главным образом, ориентирован на низкие скорости, на нем базируются многие стандарты. Испытания показывают его приемле­мость и для высоких скоростей. Стан­дарт для скорости 16 кбит/с с ма­лой задержкой (LD-CELP — Low-Delay CELP) будет рассмотрен ниже.

 



2019-07-04 342 Обсуждений (0)
CELP (Code Excited Linear Prediction) 0.00 из 5.00 0 оценок









Обсуждение в статье: CELP (Code Excited Linear Prediction)

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (342)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.006 сек.)