![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Классификация ИПС. Обзор поисковых систем общего назначения.
• По характеру предоставления логической организации хранимой информации разделяются на фактографические, документальные и геоинформационные. Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию. В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент. Другим критерием классификации поисковых систем являются функции или решаемые задачи. Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов. Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области. Расчетные заключается в обработке информации, находящейся в системе, по определённым расчётным алгоритмам для различных целей.
15. Модели информационного поиска. Теоретико-множественные. + 16. Модели информационного поиска. Вероятностные. + 17. Модели информационного поиска. Алгебраические. = • Классические модели информационного поиска рассматривают документ как множество составляющих этот документ слов, которые принято называть термами. Терм – просто слово, семантика которого помогает описать основное содержание документа.
Формально модель состоит из четырех составляющих
D – множество используемых типов представлений документов
Классические модели делят на три класса.
· Теоретико Множественная Модель – использует в качестве каркаса теорию множеств. Пример – булева модель документа как множества содержащихся в нем термов.
· Вероятностная Модель? – использует в качестве каркаса теорию веросятностей, в качестве оценки релевантности берется вероятность того, что данный документ будет признан пользователем отвечающим его информационной потребности
· Алгебраическая Модель? – документ описывается в виде векторов в многомерном пространстве, каркасом являются алгебраические методы.
В силу своей простоты популярные теоретико-множественные модели. Вероятностная модель, несмотря на наиболее естественный способ формально описать проблему поиска – не пользуется популярностью. Наибольшей популярностью у исследователей пользуются алгебраические модели, поскольку их практическая эффективность обычно оказывается выше. В последнее время часто используются гибридные модели поиска, которые обладают свойствами моделей разных классов.
|