![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Web Mining
Web Mining можно перевести как " добыча данных в Web". Web Intelligence или Web Интеллект готов " открыть новую главу" в стремительном развитии электронного бизнеса. Способность определять интересы и предпочтения каждого посетителя, наблюдая за его поведением, является серьезным и критичным преимуществом конкурентной борьбы на рынке электронной коммерции. Системы Web Mining могут ответить на многие вопросы, например, кто из посетителей является потенциальным клиентом Web-магазина, какая группа клиентов Web-магазина приносит наибольший доход, каковы интересы определенного посетителя или группы посетителей. Технология Web Mining охватывает методы, которые способны на основе данных сайта обнаружить новые, ранее неизвестные знания и которые в дальнейшем можно будет использовать на практике. Другими словами, технология Web Mining применяет технологию Data Mining для анализа неструктурированной, неоднородной, распределенной и значительной по объему информации, содержащейся на Web-узлах. Согласно таксономии Web Mining [31], здесь можно выделить два основных направления: Web Content Mining и Web Usage Mining. Web Content Mining подразумевает автоматический поиск и извлечение качественной информации из разнообразных источников Интернета, перегруженных " информационным шумом". Здесь также идет речь о различных средствах кластеризации и аннотировании документов. В этом направлении, в свою очередь, выделяют два подхода: подход, основанный на агентах, и подход, основанный на базах данных. Подход, основанный на агентах (Agent Based Approach), включает такие системы: · интеллектуальные поисковые агенты (Intelligent Search Agents); · фильтрация информации / классификация; · персонифицированные агенты сети. Примеры систем интеллектуальных агентов поиска: · Harvest (Brown и др., 1994), · FAQ-Finder (Hammond и др., 1995), · Information Manifold (Kirk и др., 1995), · OCCAM (Kwok and Weld, 1996), and ParaSite (Spertus, 1997), · ILA (Information Learning Agent) (Perkowitz and Etzioni, 1995), · ShopBot (Doorenbos и др., 1996). Подход, основанный на базах данных (Database Approach), включает системы: · многоуровневые базы данных; · системы web-запросов (Web Query Systems); Примеры систем web-запросов: · W3QL (Konopnicki и Shmueli, 1995), · WebLog (Lakshmanan и др., 1996), · Lorel (Quass и др., 1995), · UnQL (Buneman и др., 1995 and 1996), · TSIMMIS (Chawathe и др.., 1994). Второе направление Web Usage Mining подразумевает обнаружение закономерностей в действиях пользователя Web-узла или их группы. Анализируется следующая информация: · какие страницы просматривал пользователь; · какова последовательность просмотра страниц. Анализируется также, какие группы пользователей можно выделить среди общего их числа на основе истории просмотра Web-узла. Web Usage Mining включает следующие составляющие: · предварительная обработка; · операционная идентификация; · инструменты обнаружения шаблонов; · инструменты анализа шаблонов. При использовании Web Mining перед разработчиками возникает два типа задач. Первая касается сбора данных, вторая - использования методов персонификации. В результате сбора некоторого объема персонифицированных ретроспективных данных о конкретном клиенте, система накапливает определенные знания о нем и может рекомендовать ему, например, определенные наборы товаров или услуг. На основе информации о всех посетителях сайта Web-система может выявить определенные группы посетителей и также рекомендовать им товары или же предлагать товары в рассылках. Задачи Web Mining согласно [31] можно подразделить на такие категории: · Предварительная обработка данных для Web Mining. · Обнаружение шаблонов и открытие знаний с использованием ассоциативных правил, временных последовательностей, классификации и кластеризации; · Анализ полученного знания.
|