Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Определение понятия «понимание текста компьютером». Уровни автоматического понимания текста.






База знаний – это определённым образом организованные лингвистические и нелингвистические данные, а также правила их обработки.

Определение понятия «понимание текста компьютером».

Проблема понимания текста компьютером ещё находится на начальной стадии изучения, поэтому существуют разные точки зрения на проблему компьютерного понимания. Наиболее сложным для понимания являются тексты, описывающие взаимоотношения и поступки действующих лиц. В этом случае в ПК должны храниться большие базы знаний об окружающем мире. Более простыми являются тексты, содержащие описание фрагментов статического мира. Понимание в таких системах трактуется как извлечение из текста наиболее существенной, с точки зрения ПК, информации. Полученная в результате понимания информация может пополнить базу знаний компьютерной системы или может быть передана пользователю. Под передачей понятого пользователю имеют в виду способность ПК отвечать на вопросы пользователя относительно событий описанных в тексте не в виде отдельных предложений или слов, а в виде связного текста. В общем плане, согласно современным теориям автоматического понимания текстов, ПК понял текст, если он может:

· кратко изложить его содержание

· ответить на вопросы к этому тексту

· на основе текста нарисовать картинку или схему

· приведённые в тексте сведения представить в иной форме (в виде таблицы или графика)

· на основе анализа текста, написанного на одном языке, выдать адекватную информацию на другом языке

· сравнить содержание двух разных текстов и выдать информацию о том, что в них общего и в чём различия

· путём анализа одного или нескольких разных текстов извлечь такие знания, которые можно поместить в некоторую базу знаний

Уровни автоматического понимания текста.

Компьютерное понимание текста реализуется в рамках решения конкретной относительно узкой задачи. Соотнося уровни понимания текста компьютером с основными уровнями языка можно выделить следующие уровни автоматического понимания:

1. МОРФОЛОГИЧЕСКИЙ. Морфологическое понимание сводится к автоматическому приписыванию каждому слову текста его морфологических характеристик. В последние годы такие операции легко реализуется в рамках автоматического лексико-грамматического анализа при создании корпусов текста. Корпус текста – совокупность текстов, являющихся достаточными для обеспечения надёжных научных выводов о некотором языке, диалекте.

2. СИНТАКСИЧЕСКИЙ. Суть синтаксического понимания текста заключается в автоматическом выделении в каждом предложении текста главных и второстепенных членов и установления между ними различных типов связи.

3. СЕМАНТИЧЕСКИЙ. В процессе семантического понимания текста автоматически устанавливаются значения, выделенные на синтаксическом уровне. ПК определяет например: выражено подлежащее одушевлённым или неодушевлённым существительным; сказуемое выражено глаголом движения или чувствования; обстоятельство какое (места, времени, …). Подобные процедуры проводятся с опорой на необходимое окружение, с которым всегда связано данное слово.

4. ГИПЕРСИНТАКСИЧЕСКИЙ, ИЛИ ПРАГМАТИЧЕСКИЙ. Гиперсинтаксическое понимание связано с выяснением семантических отношений между предложениями текста и с выявлением соответствующей тексту ситуации реальной действительности.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.005 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал