Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Обработка данных комплекса при отсутствии эталонных объектов.






Отсутствие эталонных объектов, на которых проводится оценка статистических характеристик и информативности изучаемых признаков, приводит к необходимости разработки алгоритмов обработки данных комплекса на принципах самообучения. Распознование образов без обучения на эталонных объектах называется самообучением. При этом число классов и статистические характеристики (распределение) признаков по каждому классу должны быть получены в процессе обработки исходных данных. При распозновании образов без обучения термин «классификация» больше отвечает сущности задачи, поскольку в конечном итоге площадь исследования разделяется на конкретное число однородных по комплексу признаков классов. Геологическая природа таких классов остается неизвестной из-за отсутствия возможности их сравнения с некоторыми эталонами, для ее установления требуется проведение горнобуровых работ. Однако необходимость разбуривания по сети здесь отпадает, т.к. достаточно бурения одной скважины для каждого класса. Классификация геологических объектов без обучения приобретает особое значение при обработке данных рудной геологии и геофизики в сложно построенных в геологическом отношении районах, когда сложный и непостоянный характер геофизических полей обычно исключает возможность использования эталонных объектов.

Среди существующих алгоритмов классификации выделяются:

Ø эвристические, использующие различные приемы суммирования признаков;

Ø корреляционные, базирующиеся на аппарате компонентного и факторного анализа;

Ø статистические, основанные на проверке статистических гипотез.

Эвристические алгоритмы классификации

Эти алгоритмы обычно строятся в предположении независимости признаков и одинаковой их информативности. Так, в одном из алгоритмов суммирования диапазон значений каждого признака разбивается на заданное и одинаковое по каждому признаку число градаций, например четыре. Каждый признак принимает одну из четырех градаций: 1, 2, 3, 4. В предположении о независимости и нормальном распределении значений признаков при делении объектов на два класса порог принятия решения согласно критерию максимального правдоподобия при суммировании равен полусумме наибольших градаций всех признаков.

В тех же предположениях о признаках проводится суммирование полных нормированных градиентов, предварительно рассчитанных по методике Березкина для каждого признака в отдельности. Помимо равновесного суммирования признаков, когда равновесность, т.е. равная информативность, обеспечивается делением признаков на одно и то же число разрядов, используются алгоритмы неравновесного суммирования.

Корреляционный алгоритм

Алгоритм позволяет провести классификацию геологических объектов по зависимым друг от друга признакам, а с помощью дисперсионного анализа оценить значимость вклада (весового коэффициента) каждого признака.

Алгоритмы классификации на основе проверки статистических гипотез

Эвристические и корреляционные алгоритмы классификации позволяют успешно решать задачи разделения объектов по комплексу признаков обычно на два класса. В общем случае требуется разделение объектов на большее число классов, причем с учетом искажения исходных данных помехами и возможной интерференцией аномальных эффектов. Такая задача не может быть решена при ограниченном объеме исходных данных, и необходимость использования измерений по площади при этом становится совершенно очевидной. Один из алгоритмов в предположении о независимости признаков основан на проведении классификации путем выделения аномалий на фоне помех по каждому из признаков, в частности по способу адаптивной фильтрации.

Все выявленные этим способом аномалии являются границами некоторых однородных по своим статистическим параметрам областей в плане. Такие области выделяются по каждому признаку в отдельности. Выбранный с целью обнаружения аномалий порог принятия решения предопределяет число областей по каждому признаку, а в конечном итоге и число классов, выделенных по комплексу признаков. Для выделенных областей каждого признака строят гистограммы и сравнивают их между собой на основе критерия χ 2 с целью объединения мало различающихся по статистическим параметрам областей в один класс. В результате такой процедуры осуществляется разделение объектов наблюдений по каждому признаку на определенное число классов, охарактеризованных соответствующими оценками плотностей распределения (гистограммами) признаков.

Завершающая процедура алгоритма классификации состоит в определении индекса комплексного класса. С этой целью полученные по каждому признаку гистограммы распологают в порядке возрастания их средних значений, при равенстве средних – в порядке возрастания дисперсий. Решение о принадлежности искомого объекта к тому или иному классу по признаку хi принимается по максимальному значению апостериорной вероятности (критерию максимума апостериорной вероятности), вычисляемой для каждого класса по формуле Байеса.

Соответствующие решения принимаются по каждому признаку в отдельности. В результате вся площадь съемки разбивается на некоторое число непересекающихся между собой участков произвольной формы, охарактеризованных индексами, указывающими на принадлежность данного участка к тому или иному комплексному классу. Например, комплексный класс с индексом 213 означает, что объект принадлежит ко второму классу первого признака, к первому классу второго признака и к третьему классу третьего признака. Для большого числа признаков обозначение комплексных классов следует сводить к одной цифре или букве, имеющей соответствующие идентификаторы, например А-213. Другие алгоритмы классификации, основанные на принципах самообучения, содержат адаптивные процедуры самой классификации.

 

Список используемой литературы:

1. В.И. Дмитриев. Вычислительная математика и техника в разведочной геофизике. Справочник геофизика. Москва, «Недра», 1990.

2. А.А. Теоретические основы обработки геофизической информации. Москва, «Недра», 1986.

3. Г.С. Вахромеев, А.Ю. Давыденко. Моделирование в разведочной геофизике. Москва, «Недра», 1987.

 

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал