Оценка качества восстановленного речевого сигнала.
Оценка качества речевого сигнала является важной задачей. Отношение сигнал/шум (ОСШ), являющееся одной из наиболее распространенных объективных мер для оценки качества фильтрации зашумленного речевого сигнала, задается выражением
, (4)
где s ( n ) и – выборочные значения исходного и восстановленного речевого сигнала соответственно; M – общее число выборок в пределах речевого сигнала. Данное ОСШ является интегральной мерой качества восстановления речи. Более точной мерой, учитывающей присутствие в речевом сигнале низко амплитудных компонент, является сегментное ОСШ (СЕГОСШ), основанное на вычислении кратковременного ОСШ для каждого N-точечного сегмента речи
, (5)
где L и N – число сегментов и отсчетов в сегменте речевого сигнала соответственно; i – номер сегмента речевого сигнала;M = LN – число отсчетов речевого сигнала, состоящего из L сегментов с N отсчетами. Так как операция усреднения осуществляется после логарифмирования, то СЕГОСШ более точно оценивает качество фильтрации нестационарного речевого сигнала. На рис. 7 представлен график зависимости ОСШ сигнала и коэффициента сжатия при фильтрации речевого сигнала статистическим методом. Из рис. 7 видно что ОСШ экспоненциально убывает с увеличением коэффициента сжатия. Например при коэффициенте сжатия 3 ОСШ равно 3,2.
Рис. 7. График зависимости ОСШ сигнала и коэффициента сжатия при фильтрации речевого сигнала статистическим методом
Обзор методов повышения качества и разборчивости зашумленных речевых сигналов показывает, что существует много различных подходов к обработке зашумленной речи. Такое разнообразие методов обусловлено как важностью проблемы так и отсутствием достаточно надежных методов ее решения. Объективное сравнение этих методов и выбор наиболее приемлемых сделать весьма затруднительно, так как перед системами коррекции речевых сигналов ставятся различные задачи. Например, можно в качестве главного критерия использовать повышение разборчивости речи, допуская при этом возможность искажений в тембре голоса или появление артефактов в виде структурированного шума. Можно поставить целью понижение утомляемости аудитора или сохранение натуральности голоса диктора, что достигается в основном за счет повышения качества речевого сигнала. Наконец, могут быть известны заранее важные априорные сведения, например тип или параметры шума, характеристики голоса диктора, наконец, гипотезы о произносимом тексте, что также может определяющим образом повлиять на выбор метода фильтрации. Важно отметить, что универсальных методов обработки, которые одинаково хорошо боролись бы с существенно нестационарными и стационарными, аддитивными и мультипликативными шумами, существенно повышали бы качество и одновременно разборчивость речи, сейчас нет, и возможно не будет. Как типичная (за редкими, указанными в обзоре исключениями, наблюдается обратная тенденция: если сравнивать системы обработки зашумленной речи по двум показателям - повышению качества звучания речевых сигналов и повышению разборчивости, то системы, повышающие качество и натуральность звучания, скорее всего снижают разборчивость и наоборот, повышение разборчивости приводит к понижению качества и натуральности звучания. Поэтому, многие из названных методов фильтрации нужно рассматривать как взаимодополняющие, и в идеальном случае нужно иметь библиотеку из нескольких методов фильтрации. Рассматривая последние тенденции в области обработки зашумленных сигналов, следует особенно выделить высокие результаты, полученные за счет использования математических моделей речевых сигналов, а также использование нейроподобных структур для фильтрации аддитивных стационарных шумов, хотя первые результаты в этом направлении проигрывают более традиционным методам типа минимальной среднеквадратической оценки. Литература 1. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи.- М.: Радио и связь, 2000. 2. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов.-М.: Радио и связь, 20011. 3. Секунов Н.Ю. Обработка звука на PC.- СПб.: БХВ-Петербург, 2001. 4. Нейрокомпьютеры в системах обработки изображений. – М.: Радиотехника, 2003. 5. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов.- М.: Радио и связь, 2005.
Популярное: Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (335)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |