Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Типы автоматического понимания текста.






Компьютерная система, понимающая письменный текст, должна иметь в своей базе знаний определённую информацию:

1. знание о языке, на котором написан текст

2. правила использования знаний о языке

3. знания о реальном мире (конкретной предметной области)

4. правила использования соответствующих знаний о фрагменте реального мира

5. знание о пользователе системы, желающем получить от ПК некоторое понимание.

В зависимости от сложности используемых знаний и их количества различают следующие типы автоматического понимания письменных текстов:

1. понимание-узнавание (при этом в ПК имеются лишь знания о языке). Суть понимания сводится к тому, что ПК узнаёт морфологическую структуру каждого слова, предложения, проводит синтаксический анализ предложений, узнаёт ключевые слова, словосочетания, предложения. По этому принципу работают системы автоматического аннотирования, реферирования, индексирования.

2. Понимание-уподобление (ПК должен иметь знания о языке и правила использования этих знаний). Считается, что система понимает текст, если она может ответить на вопросы по этому тексту. При таком понимании ПК просто находит готовые ответы в своей базе знаний, ранее занесённой человеком (таким образом, ПК уподобляется человеку).

3. Понимание-прогнозирование (ПК дожжен иметь знания о языке, правила использования этих знаний, и знания о конкретной предметной области). Эти системы ориентированы на понимание текстов достаточно узкой предметной области. Считается, что система понимает текст, если она может определить, какой объект или событие предметной области соответствует отдельным фрагментам этого текста. Однако одним и тем же фрагментом текста могут соответствовать разные объекты или события, поэтому соотносить их можно лишь с определённой степенью вероятности (отсюда термин «прогнозирование»).

4. Понимание-объединение (в базе знаний представлены 4 вида знаний: знания о языке, правила их использования, знания о предметной области и правила использования этих знаний). Объединяя эти виды знаний, компьютерная система должна уметь делать выводы, умозаключения по тексту, а также объяснять, почему она сформировала тот или иной вывод (эта работа экспертных систем).

5. Понимание-объяснение (автоматическая система имеет в своей базе знаний все пять видов знаний, включая знания о целях, намерениях, профессиональной компетенции пользователя). Система должна уметь объяснить пользователю, каким образом она поняла текст. Так как система должна давать объяснения любому конкретному пользователю с учётом уровня его образования знаний и опыта. В таких системах используется диалог «компьютер – пользователь».

Сегодня проблема автоматического понимания реализована в следующих компьютерных системах, позволяющих извлекать из текста определённую информацию:

1. система автоматического индексирования, аннотирования, реферирования текстов и перевода

2. информационные и информационно-поисковые системы

3. экспертные системы, выступающие в роли высокопрофессионального специалиста в какой-то предметной области.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал