Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Пример решения задачи
Программное обеспечение, позволяющее работать с картами Кохонена, сейчас представлено множеством инструментов. Это могут быть как инструменты, включающие только реализацию метода самоорганизующихся карт, так и нейропакеты с целым набором структур нейронных сетей, среди которых - и карты Кохонена; также данный метод реализован в некоторых универсальных инструментах анализа данных. К инструментарию, включающему реализацию метода карт Кохонена, относятся SoMine, Statistica, NeuroShell, NeuroScalp, Deductor и множество других. Для решения задачи будем использовать аналитический пакет Deductor. Пусть имеется база данных коммерческих банков с показателями деятельности за текущий период. Необходимо провести их кластеризацию, т.е. выделить однородные группы банков на основе показателей из базы данных, всего показателей - 21. Исходная таблица находится в файле " banks.xls". Она содержит показатели деятельности коммерческих банков за отчетный период. Сначала импортируем данные из xls-файла в среду аналитического пакета. На первом шаге мастера запускаем мастер обработки и выбираем из списка метод обработки " Карта Кохонена". Далее следует настроить назначения столбцов, т.е. для каждого столбца выбрать одно из назначений: входное, выходное, не используется и информационное. Укажем всем столбцам, соответствующим показателям деятельности банков, назначение " Входной". " Выходной" не назначаем. Следующий шаг предлагает разбить исходное множество на обучающее, тестовое и валидационное. По умолчанию, программа предлагает разбить множество на обучающее - 95% и тестовое - 5%. Эти шаги аналогичны шагам в мастере обработки для нейронных сетей, описанным в предыдущей Лекции. На шаге № 5, изображенном на рисунке 10.14 предлагается настроить параметры карты: количество ячеек по Х и по Y их форму (шестиугольную или четырехугольную).
На шестом шаге " Настройка параметров остановки обучения", проиллюстрированном на рисунке 10.15, устанавливаем параметры остановки обучения и устанавливаем эпоху, по достижению которой обучение будет прекращено.
Рисунок 10.15 - Шаг № 6 " Настройка параметров остановки обучения" На седьмом шаге, представленном на рисунке 10.16, настраиваются другие параметры обучения: способ начальной инициализации, тип функции соседства. Возможны два варианта кластеризации: автоматическое определение числа кластеров с соответствующим уровнем значимости и фиксированное количество кластеров (определяется пользователем). Поскольку нам неизвестно количество кластеров, выберем автоматическое определение их количества.
На восьмом шаге запускаем процесс обучения сети - необходимо нажать на кнопку " Пуск" и дождаться окончания процесса обучения. Во время обучения можем наблюдать изменение количества распознанных примеров и текущие значения ошибок. Этот процесс аналогичен тому, что мы рассматривали при обучении нейронных сетей в предыдущей лекции. По окончании обучения в списке визуализаторов выберем " Карту Кохонена" и визуализатор " Что-если". На последнем шаге настраиваем отображения карты Кохонена, этот шаг проиллюстрирован на рисунке 10.17.
Укажем отображения всех входных, выходных столбцов, кластеров, а также поставим флажок " Границы кластеров" для четкого отображения границ.
|