![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Структура системы машинного перевода и назначение её основных блоков.
Системы машинного перевода (СМП) являются моделями, которые воспроизводят на ПК речевое поведение человека, переводящего текст с одного языка на другой язык.
1. В процессе морфологического анализа слов предложения исходного языка, каждое слово получает наборы лексико-грамматических признаков. ПК формирует эти наборы с опорой на двуязычный автоматический словарь. 2. Синтаксический анализ предложений исходного языка сводится к поиску основных членов предложения (выделения подлежащего, сказуемого и т.д.), формируется структура. 3. Синтаксический синтез предложений переводного языка заключается: а) в создании структуры предложений переводного языка, определяемый правилами ПЯ и ИЯ, что выполняется на основе блока «синтаксические соответствия»; б) замена слов исходного языка на их переводные эквиваленты. 4. Каждое слово предложения ПЯ ставится в нужную форму, для чего используется двуязычный словарь. Успех СМП во многом зависит от автоматических словарей. При создании словаря решаются следующие задачи: 1. Выбор типа лексической единицы для словаря; используется два способа представления лексической единицы: а) в виде словоформ, т.е. в словарь заносятся всевозможные формы каждого слова и подаются гнёздами; б) в виде квазиосновы: выключ. # … 003 (числа, стоящие после решётки наборы лексико-грамматических признаков (суффикс, окончание и т.д.), которые необходимо присоединить к основе, чтобы получить соответствующие формы слов, они называются типами форм слов). 2. Отбор лексики для входного словаря и отбор переводных эквивалентов для выходного словаря. При выборе лексической единицы словоформу целесообразно использовать для языков аналитического типа (английский, французский, т.е. те, которые имеют мало форм), а для флективных и аглюциативных целесообразно использовать квазиоснову (русский, немецкий, белорусский). (Вывод) Обе технологии машинного перевода имеют свои положительные и отрицательные стороны. Поэтому наметилась тенденция объединить оба метода. Promt уже два года разрабатывает гибридную систему перевода, что позволит: 1. сохранить преимущества традиционной технологии (формирование синтаксически связанного и грамматически правильного текста) 2. получить преимущества (быстрая обучаемость) 3. получение данных из параллельных корпусов и гладкость текста. Promt, Systran (на западе) Преимущества использования СМП: 1. ускорение перевода à экономия времени 2. МП научно0технических документов приближается к переводу, выполненному человеком 3. можно доверить перевод конфиденциальной информации 4. экономия денег 5. облегчает просмотр веб-сайтов
|