Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Оценивание артикуляционной и словесной разборчивости речи ⇐ ПредыдущаяСтр 4 из 4
При достаточно больших уровнях шума эффективный уровень ощущения речевого сигнала в каждом из частотных каналов равен отношению сигнал-шум в этом канале [1, 2]: . (4) Эффективный уровень ощущения формант вычисляют, уменьшая (4) на разницу спектральных уровней речи и формант: , (5) где - центральные частоты каналов; . (6) Артикуляционную (формантную) разборчивость вычисляют как сумму разборчивостей формант в каждой из полос: , (7) где - коэффициент восприятия речи: , (8) - вероятность пребывания формант в -том частотном диапазоне, ограниченном частотами и : , (9) . (10) Словесная разборчивость может быть вычислена по формантной разборчивости: . (11) Учитывая громоздкость приведенных выше соотношений, вычисления проще реализовать в виде m-файла: % ============================================== % вычисление формантной и словесной разборчивости % ============================================== % ===== входные данные: ====== i = 1: 5; Q(1) = q1(1, 1, end); Q(2) = q2(1, 1, end); Q(3) = q3(1, 1, end); Q(4) = q4(1, 1, end); Q(5) = q5(1, 1, end); f0 = [250; 500; 1000; 2000; 4000]; % центральные частоты полос анализа fn = [180; 355; 710; 1400; 2800]; % нижние граничн.частоты полос анализа fv = [355; 710; 1400; 2800; 5600]; % верхние граничн.частоты полос анализа % % ===== уровни ощущен. ======== for i = 1: 5 if f0 < = 1000 E(i) = Q(i) - (200/f0(i).^0.43-0.37); Else E(i) = Q(i) - (1.37+1000/f0(i).^0.69); End End % % ===== коэф.воспр. ======= for i = 1: 5 if E(i) < = 0 P(i) = (0.78+5.46*exp(-4.3*10^(-3)*(27.3-abs(E(i))).^2))/(1+10^(0.1*abs(E(i)))); Else P(i) = 1-(0.78+5.46*exp(-4.3*10^(-3)*(27.3-abs(E(i))).^2))/(1+10^(0.1*abs(E(i)))); End End % % ======== вер-сти формант ====== for i = 1: 5 if f0(i) < = 400 pv(i) = 2.57*10^(-8)*(fv(i).^2.4-fn(i).^2.4); Else pv(i) = 1.074*(exp(-10^(-4)*fn(i).^1.18)-exp(-10^(-4)*fv(i).^1.18)); End End % % ======== артикуляционная (формантная) разборчивость ======== A = sum(pv.*P); % % ======== словесная разборчивость ========= if A< 0.15 W = 1.54*A^0.25*(1-exp(-11*A)); Else W = 1-exp(-11*A/(1+0.7*A)); End % вывод результатов на дисплей disp('Формантн.разборч. = '), disp(A); disp('Словесн.разборч. = '), disp(W);
Пример 1. Для отношения сигнал-шум – 18, 7 дБ получены: формантная разборчивость A = 0.0041, словесная разборчивость W = 0.0172. Пример 2. Для отношения сигнал-шум – 14, 7 дБ получены: формантная разборчивость A= 0.0104, словесная разборчивость W = 0.0531 Полученные результаты хорошо согласуются с таковыми для среднестатистического спектра речевого сигнала (полученного путем усреднения нескольких тысяч спектров речи разных дикторов).
|