Синтез устной речи с помощью ПК.

⇐ ПредыдущаяСтр 20 из 22Следующая ⇒

Существуют три основных метода автоматического синтеза речи:

1. кодирование (запись в двоичном виде) речевых сигналов с их последующим восстановлением. По существу ПК в данном случае служит устройством для записи речи. Слова и фразы записываются в ПК заранее и в нужный момент воспроизводятся по командам. Возможность сказать слово или фразу, которые не были занесены в память ПК, невозможна. Ещё один недостаток: для хранения речевых сигналов в их непосредственной форме нужна память значительного объёма. Речь звучит естественно, по качеству приближается к человеческой.

2. Фонетический синтез речи, или акустическое моделирование голосового тракта человека. Синтезатор, построенный в соответствии с этим методом, принципиально отличается от описанного выше и имеет неестественное звучание речи. Синтезатор говорит голосом робота. Поскольку речь создаётся из отдельно синтезируемых звуков, правильно расставив нужные звуки, компьютер может произнести слово. Как правило, фонетический синтез речи осуществляется по орфографическому тексту, написанному человеком. ПК умеет преобразовать буквы в фонемы, а фонемы в их варианты – аллофоны – и синтезировать непрерывный речевой сигнал с использованием аллофонов конкретного диктора, выбираемого из базы данных. По мере совершенствования речь синтезаторов становится всё более разборчивой. Этот метод синтеза речи весьма перспективен, так как позволяет озвучить любой текст.

3. Математическое моделирование голосового тракта человека. Словарь в синтезаторах этого типа как и в первом методе обычно создаётся с участием говорящего человека. Но в данном случае в память ПК записываются не слова и фразы, а производится выделение числовых характеристик звуков речи и интонации фраз. Такой подход позволяет значительно уменьшить объём памяти. В этом заключается основное достоинство этого метода. Как и в первом методе, синтезируемая речь звучит естественно. Для её генерации числовые характеристики преобразуются обратно в звуковые сигналы, из которых строится речевой поток.

Наиболее перспективным является фонетический синтез речи. В настоящее время специалисты работают над тем, чтобы синтезируемая компьютером речь по тексту звучала живо, естественно, эмоционально. Решение этой проблемы позволит создавать компьютерные системы синхронного перевода, активнее использовать компьютер в обучении языка, а также людьми с нарушением органов зрения.

⇐ Предыдущая 13 14 15 16 17 18 192021 22 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.007 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал