Мегаобучалка Главная | О нас | Обратная связь


Кодирование речи в системе INMARSAT-M



2019-07-04 369 Обсуждений (0)
Кодирование речи в системе INMARSAT-M 0.00 из 5.00 0 оценок




 

Для системы мобильной спутни­ковой связи INMARSAT была выбра­на улучшенная версия речевого коде­ра МВЕ, описанного в предыдущем параграфе как вер­сия стандарта на скорости 6,4 кбит/с для наземных систем подвижной свя­зи. Размер фрейма кодера 20 мс. При этом обеспечивается кодирование ис­точника и канала с помощью 128 бит на каждый фрейм. Из этих 128 бит 45 (2,25 кбит/с) зарезервированы для коррекции ошибок, а оставшиеся 83 би­та (4,15 кбит/с) разделены между раз­личными параметрами речи, как пока­зано в табл. 5.5.


 

Таблица 5.5

Распределение бит в системе INMARSAT-M

Параметр Число бит
Основная частота 8
Информация вокал/невокал b
Спектральные амплитуды 75 – b

 

Синтез речи в МВЕ декодере тре­бует информации об основной частоте, решении вокал/невокал, спектраль­ных величинах и фазах вокализиро­ванных гармоник. Так как фазы вока­лизированных гармоник можно пред­сказать, информация о фазе не пере­дается от кодера к декодеру. Основная частота (основной тон) обычно кван­туется с половинной точностью вы­борки во временной области, причем возможный диапазон тона перекры­вается восемью битами. Решение во­кал/невокал является двоичным чи­слом и не требует квантования. Набор спектральных величин требует большей точности и эффективности кван­тования. Общее распределение бит для каждого фрейма следующее:

1) восемь бит для точного кванто­вания тона;

2) b бит для решения вокал/не­вокал, где b – число полос принятия решения вокал/невокал;

3) оставшиеся биты для квантова­ния гармоник.

Так как число гармоник зависит от основного тона, который изменя­ется, число бит, присваиваемых для решения вокал/невокал, может так­же изменяться. Типичное число вокализированных/невокализированных полос равно 12 (4), что означает, что максимальное число бит для описания вокал/невокал равно 12. Общее чи­сло бит  для квантования гармоник определяется формулой

где максимум b равен 12;  – общее число бит для фрейма.

Рассмотрим способ квантования, ис­пользуемый в системе INMARSAT-M.

Квантование основной часто­ты. Основная частота квантуется при преобразовании ее в эквивалентный период основного тона . Значения периода основного тона обычно ограни­чены диапазоном . В си­стеме МВЕ, предназначенной для ра­боты на скорости 6,4 кбит/с, этот пара­метр равномерно квантуется с исполь­зованием 8 бит при размере шага 0,5, что дает возможность обеспечить поло­винную точность выборки.

Кодирование решений во­кал/невокал. b решений вокал/не­вокал являются двоичными числами, поэтому могут быть закодированы с использованием одного бита для ка­ждой полосы решения. Система на скорости передачи 2,4 кбит/с исполь­зует максимум 12 полос, каждая с ши­риной  Гармоники вне b полос во­кал/невокал приняты невокализированными.

Квантование спектральных величин. Перед квантованием спек­тральных величин для уменьшения их изменения используется этап предска­зания.

Остатки предсказания группиру­ются в шесть последовательных бло­ков, содержащих  остаточных выборок каждый. Каждый блок преобразуется по частоте с использованием дискретного косинусоидального преобразования (ДКП) размером .

Постоянные составляющие L шести ДКП-блоков (первые коэффициенты) группируются как вектор и квантуются с использованием кодовой книги шестибитового скалярного усиления и десятибитового вектора формы. Коэффициенты более высокого порядка М квантуются с использованием скалярных квантователей, где в процессе присвоения бит распределяются оставшиеся биты в соответствии с важностью для субъективного восприятия каждой величины. Блок-схема общей процесса квантования величин показана на рис. 5.8.

Рисунок 5.8

После правильного восстановления спектральных величин МВЕ-кодер пытается улучшить качество восприятия синтезированной речи с использованием усилителя. Усиление спектральных величин выполняется генерированием набора спектральных ве­сов из принятых параметров текущего фрейма.

В типичном МВЕ-кодере большая часть бит выделена для квантования спектральных величин. В случае си­стемы INMARSAT-M, где кодер источ­ника работает на скорости 4,15 кбит/с при скорости фреймов 50 Гц, только 20 (8+ 12) бит используются для форми­рования информации об основном пе­риоде и информации «вокал/невокал». Остальные биты используются для квантования спектральных величин. Таким образом, для успешного синте­за речи необходимо точно знать основ­ной период. Для покрытия речевого спектра 4 кГц достаточно 12 полос во­кал/невокал. В результате общая ско­рость кодера может быть уменьшена за счет более эффективного квантова­ния величин. В системе INMARSAT-M все спектральные величины, кроме ше­сти, проквантованы с использованием скалярных квантователей. Сокраще­ние скорости можно добиться также за счет векторного квантования всех величин. Однако, так как число спек­тральных величин может изменяться от 9 до более чем 60 в зависимости от основной частоты, векторную кодо­вую книгу, учитывающую эти измене­ниями, создать очень сложно. Поэто­му целесообразно векторное квантова­ние использовать только для основной формы спектра, которая может быть принята независимой от основной ча­стоты.


 



2019-07-04 369 Обсуждений (0)
Кодирование речи в системе INMARSAT-M 0.00 из 5.00 0 оценок









Обсуждение в статье: Кодирование речи в системе INMARSAT-M

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (369)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.007 сек.)