Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Вероятностный подход к описанию сцены

 

Формальное определение пикселя, сцены и изображения сцены. Объект и его изображение. Распределение изображений объекта. Теорема существования.

 

Будем рассматривать сцену как совокупность неделимых элементов, называемых далее пикселями. Каждый пиксель характеризуется индивидуальными целочисленными координатами , заданными на двумерной целочисленной решетке

 

,

 

и скалярной случайной величиной со значениями из конечного множества , содержащего элементов. Далее будет предполагаться, если не оговорено противное, что . Случайная величина описывает исследуемое свойство пикселя, значение которого становится известно только после его измерения (съемки). Предполагается, что все случайные величины определены на одном и том же вероятностном пространстве . В качестве можно выбрать, например, множество всех отображений вида , а множество всех подмножеств из - в качестве -алгебры . Способы задания вероятности на обсуждаются далее в 2.2. Счетное семейство случайных величин принято называть в теории вероятностей случайным полем на . В настоящей работе оно будет называться также сценой.

Пусть - некоторое элементарное событие из и . Для каждой случайной величины можно вычислить выборочное значение . Скалярное отображение , определяемое для любого равенством и обозначаемое , будет называться изображением сцены.

При решении прикладных задач довольно часто интерес представляют не отдельные пиксели, а их конечные совокупности, которые будут называться объектами. Каждый объект определяется конечным подмножеством точек из , которые являются координатами его пикселей, и семейством из скалярных случайных величин. Подмножество называется далее проекцией объекта. Предполагается, что проекции разных объектов не пересекаются, а их объединение совпадает с . Изображением объекта будет называться сужение на изображения всей сцены. Далее символом будет обозначаться множество

 

=

 

всех изображений объекта .

Если сцена задана, то для любого изображения объекта можно вычислить его вероятность

 

= .

 

Очевидно, что

 

и .

 

Поэтому семейство = задает распределение вероятностей на множестве всех подмножеств из . Далее будет называться распределением объекта . С другой стороны, справедливо и обратное утверждение, которое удобно сформулировать в виде следующей теоремы.

Теорема 2.1.1. Пусть на задано разбиение, состоящее из ко­неч­ных попарно непересекающихся подмножеств, называемых проекциями объектов сцены, и пусть каждой проекции поставлено в соответствие распределение вероятностей на . Тогда существует вероятностное пространство и сцена такая, что

 

 

для любой проекции и для любого . Кроме того, если и - проекции разных объектов сцены, а и , то

 

.

 

Из сформулированной теоремы следует, что построение сцены, с формальной точки зрения, сводится к разбиению на конечные подмножества (проекции образующих ее объектов) и заданию для каждой проекции совместного распределения на . Свойства этих распределений определяются имеющейся информацией о соответствующих объектах сцены.

 

2.2 Бернуллиевские и локально однородные сцены

 

Причины упрощения модели сцены. Предположение о независимости пикселей. Предположение об однородности. Бернуллиевские сцены. Ковариационная функция. Однородные сцены. Теорема Слуцкого. Локально однородные сцены.

 

В соответствии с Теоремой 2.1.1 задание сцены состоит в разбиении на конечные непересекающиеся подмножества, называемые проекциями объектов, и сопоставлении каждой проекции распределения вероятностей на . Обсудим, как это можно сделать.

Очевидно, что распределение = на состоит из вероятностей. К сожалению, при решении прикладных задач априорные сведения о свойствах сцены, необходимые для определения вероятностей, образующих распределение , как правило, отсутствуют. В этих условиях приходится идти на упрощение модели сцены. Первым шагом в этом направлении, довольно часто, является отказ от учета зависимостей между случайными величинами, образующими объекты. Это означает, что для любых и справедливо равенство

 

= .

 

Из него следует, что для определения распределения объекта достаточно знать распределения вида = , , описывающие свойства его отдельных пикселей. Для этого достаточно знать вероятностей вида , , , вместо совместных вероятностей вида , .

Следующим упрощением, вызванным теми же причинами, является предположение о том, что все случайные величины, образующие объект , имеют одно и тоже распределение, то есть = для любых и любых . Это означает, что для определения на достаточно знать только распределение = на , содержащее вероятностей. Из Теоремы 2.1.1 следует существование сцены, для любого объекта которой выполняется равенство

 

= , .

 

Оно означает, что случайные величины , образующие объект , независимы в совокупности и имеют одно и то же распределение .

Из сделанных выше предположений (упрощений) следует, что изображение объекта является реализацией случайной выборки. Поэтому его можно использовать (по крайней мере, теоретически) для оценки неизвестных вероятностей распределения = и, тем более, его числовых характеристик, включая среднее значение и дисперсию . Далее сцены с указанными свойствами будут называться бернуллиевскими. В общем случае, если сцена не является бернуллиевской, относительную частоту наблюдения из на изображении объекта нельзя использовать в качестве оценки вероятности .

При отказе от любого из двух выше сформулированных предположений о свойствах сцены возникают серьезные проблемы с оценкой вероятностей распределения = на . В качестве возможного выхода из подобной ситуации предлагается для описания свойств объекта вместо распределения ограничиться средними значениями , и ковариациями случайных величин и , , , которые определяются равенством .

Из определения следует, что она является симметрической функцией. Более того, при любом натуральном , любых , , из и любых вещественных , , имеет место неравенство вида

 

= . (2.2.1)

 

Оно означает, что симметрическая функция двух переменных и является неотрицательно определенной. Доказано (см., например, [Я]), что для любого семейства вещественных чисел и любой неотрицательно определенной функции существует случайное поле такое, что

 

и = , , .

 

При этом называется, ковариационной функцией слу­чайного поля . Если при любых , и из выполняются равенства

 

и ,

 

то случайное поле называется однородным. Из этого определения следует, что при лю­бых и из . То есть зависит только от разности . Поэтому далее при рассмотрении однородных случайных полей символ будет обозначать функцию с одним переменным, определенную на .

Пусть - квадрат со стороной , а - его изображение. Если при ковариационная функция однородного случайного поля стремится к нулю, то из эргодической теоремы Слуцкого (см., например, [63, с. 60]) следует, что среднее арифметическое значение , определяемое равенством

 

= ,

 

сходится в среднем квадратичном к . Из сходимости в среднем квадратичном следует сходимость по вероятности (см., например, [ ]). Поэтому является состоятельной и несмещенной оценкой среднего значения . Строго говоря, теорема Слуцкого была доказана для стационарных случайных последовательностей и случайных процессов. Однако ее доказательство обобщается естественным образом на однородные случайные поля на .

Визуальный анализ изображений реальных сцен, полученных в разных спектральных зонах, позволяет утверждать, что средние яркости и ковариации образующих сцену объектов могут значительно отличаться друг от друга. Поэтому далее предполагается, что каждый объект сцены является фрагментом однородного случайного поля со средним значением и ковариационной функцией . Пусть

 

=

 

- квадратная окрестность точ­ки , принадлежащая проекции . Тогда среднее арифметическое значение вида

 

,

 

вычисленное по изображению квадрата , может рассматриваться в качестве оценки неизвестного среднего значения . Необходимо подчеркнуть, что в общем случае (если не выполняются условия теоремы Слуцкого) среднее арифметическое не имеет наглядной содержательной интерпретации.

В связи со сказанным будем называть далее сцену локально однородной, если каждый ее объект является фрагментом однородного случайного поля с при . Последнее предположение позволяет оценивать по изображению объекта его среднее значение.

 

2.3 Примеры сцен и изображений

 

Локально однородные (модельные) сцены. Отношение сигнал/шум. Реальные и квазиреальные сцены.

 

В настоящей работе будут использоваться сцены трех видов. К первому виду относятся локально однородные сцены, которые служат моделями реальных сцен и поэтому далее называются модельными. Изображения таких сцен создаются компьютером по соответствующим программам и используются для проведения теоретических, а также экспериментальных (численных) исследований. Кроме того, изображения модельных сцен удобно применять для проверки (тестирования) программных средств. Изложим способ построения таких сцен и их изображений, который применяется в настоящей работе.

Пусть - семейство независимых в совокупности случайных величин, имеющих одно и то же распределение со средним зна­чением равным нулю и дисперсией . Очевидно, что

 

.

 

Предполагая, что - квадратная окрестность точки с радиусом , состоящая из точек, определим для каждого случайную величину равенством

 

= .

 

По аналогии со случайными последовательностями (см., например [63, с. 83]) назовем семейство случайным полем, полученным скользящим суммированием по квадратной окрестности с радиусом . Из определения следует, что , , а

 

.

 

В частном случае, при получаем дисперсию

 

.

 

Следует иметь в виду, что в общем случае количество точек решетки, оказавшихся в пересечении зависит от разности , а не от расстояния . В самом деле, при и точки и находятся на одинаковом расстоянии от . Однако пересечение при оказывается пустым, а содержит точки и . Поэтому случайное поле, полученное скользящим суммированием, является однородным, а не изотропным.

В приложениях предпочитают применять корреляционную функцию R, которая получается из ковариационной функции после ее нормировки. Применительно к рассматриваемому случаю получаем, что

 

.

 

В качестве примера в таблице 2.1 приводятся ненулевые значения корреляционной функции случайного поля, полученного скользящим суммированием по окрестности с радиусом . Для остальных точек квадрата значения восстанавливаются на основе свойств ковариационной функции. Фрагмент размером 256 на 256 пикселей изображения такого случайного поля с ={0, 1, …, 255} представлен на рисунке 2.1.

 

Таблица 2.1 – Корреляционная функция сцены, получен­ной

скользящим суммированием с

Коорди­ната t 2 Координата t 1
         
  1.00 0.80 0.60 0.40 0.20
    0.64 0.48 0.32 0.16
      0.36 0.24 0.12
        0.20 0.08
          0.04

 

Отметим, что зависимость ковариации от разности сохраняется и при замене квадратной окрестности на круг. Однако в частном случае, когда , количество точек в пересечении двух окрестностей зависит только от расстояния . Однородные случайные поля, ковариационные функции которых зависят только от расстояния, называются однородными и изотропными. Для сравнения в таблице 2.2 содержатся ненулевые значения корреляционной функции случайного поля, полученного скользящим суммированием с . Фрагмент размером 256 на 256 пикселей изо­бра­жения такого случайного поля приведен на рисунке 2.2. Для сравнения на рисунке 2.3 приведено изображение бернуллиевской сцены.

 

Таблица 2.2 - Корреляционная функция сцены,

полученной скользящим суммированием с

| t |    
R (| t |) 1.00 0.67 0.44 0 0.33 0.22 0.11

 

В соответствии с определением случайного поля , получен-

ного скользящим суммированием по окрестности радиуса , для любых случайных величин и , если . Более того, эти случайные величины независимы. В общем случае из равенства не следует независимость случайных величин и . Исключением являются случайные величины с нормальными распределениями. Для них отсутствие корреляции, то есть выполнение равенства , эквивалентно независимости.

Каждый из трех фрагментов сцен, приведенных на рисунках 2.1-2.3, состоит из семи объектов. Шесть объектов имеют прямоугольные проекции со сторонами 29 и 14 масштабных единиц. На всех сценах эти объекты имеют одинаковые ориентацию и месторасположение, которые выбраны случайным образом. Пять из них присутствуют на приводимом фрагменте полностью. Шестой объект, находящийся у левого края фрагмента, присутствует частично. Остальные пиксели фрагмента образуют седьмой объект, который по сложившейся среди специалистов по дешифрированию изображений традиции будет называться фоном. Каждый из шести прямоугольных объектов является фрагментом однородного случайного поля со средним значением 100 и корреляционной функцией, представленной соответствующей таблицей. Фон каждой сцены является фрагментом однородного случайного поля со средним значением 130. Его корреляционная функция совпадает с корреляционной функцией прямоугольных объектов


 

 

Рисунок 2.1 - Изображение локально однородной сцены, полученной сколь­зящим суммированием с Рисунок 2.2 - Изображение локально однородной сцены, полученной скользящим суммированием с Рисунок 2.3 - Изображение бернуллиевской сцены ()

этой же сцены. Отметим, что визуальная заметность прямоугольных объектов уменьшается с увеличением .

Для каждого объекта можно вычислить величину , определяемую равенством

 

(2.4.1)

 

и называемую, обычно, отношением сигнал/шум. Хорошо известно (см., например, [56]), что с ростом вероятность обнаружения объекта при визуальном дешифрировании по изображению бернуллиевской сцены увеличивается. Далее будет показано, что с ростом улучшаются и результаты автоматического поиска объектов. Поэтому значение будет использоваться для количественной оценки качества изображения. По определению, у всех объектов трех рассмотренных сцен .

Фрагментами сцен второго типа служат различные участки поверхности Земли. Их изображения формируются ОЭС (в том числе многоспектральными). Поэтому такие сцены и их изображения называются далее реальными. Очевидно, что предположения, использованные при построении математической модели, для реальных сцен в полном объеме не выполняются. Однако хорошая модель должна быть “снисходительной” к некоторым нарушениям предположений, которые использовались при ее построении. В противном случае применимость модели для решения прикладных задач становится сомнительной.

В качестве примера одного из фрагментов реальной сцены рассмотрим участок земной поверхности, проекция которого является квадратом со стороной, равной 255 масштабным единицам или 256 пикселям. Участок порос травой (местами сильно вытоптанной), редким кустарником и отдельными деревьями. На нем присутствуют следы, оставленные колесными и гусеничными транспортными средствами. На рисунках 2.4-2.6 представленные три изображения описанного фрагмента сцены. Они получены ОЭС строчного типа с летательного аппарата в трех спектральных зонах инфракрасного диапазона: [0.7; 1.1] мкм – первая скалярная компонента, [3.0; 5.0] мкм – вторая и [8.0; 12.0] мкм – третья. По условиям съемки, длина стороны квадратного пикселя на местности должна равняться 0.3 м. На изображениях (особенно на третьем) заметны горизонтальные полосы. Эта особенность, называемая специалистами строчностью, характерна для изображений, формируемых оптико-электронными системами с механическим сканированием.

К сожалению, в ходе съемки описанной реальной сцены с целью получения ее векторного изображения не удалось обеспечить выполнение ряда важных требований. Например, для регистрации скалярных изображений, формируемых в трех спектральных зонах, над сценой приходилось пролетать два или три раза. Промежуток времени между следующими друг за другом пролетами равнялся нескольким минутам. Поэтому предполагалось, что за это время метеоусловия и состояние объектов, не успели измениться. Из-за погрешностей бортовых высотомеров линейные размеры пикселей на местности получались разными. Поэтому размеры изображений одних и тех же объектов сцены на разных скалярных компонентах оказались различными. Более того, выполнить все по­­леты по одной и той же траектории не удалось. По этой причине скалярные изображения отличаются друг от друга величиной сдвига и поворота относительно заранее выбранной системы координат. Таким образом, для получения векторного (в данном случае трехмерного) изображения фрагмента сцены и его последующего использования в экспериментах по дешифрированию требуется предварительно привести скалярные компоненты к одному масштабу и выполнить их пространственное совмещение, включающее поворот и сдвиг. Только после выполнения этих операций изображения каждого пик


 

Рисунок 2.4 - Первая скалярная компонента реальной сцены Рисунок 2.5 - Вторая скалярная компонента реальной сцены Рисунок 2.6 - Третья скалярная компонента реальной сцены

 

Рисунок 2.7 - Первая скалярная компонента квазиреальной сцены Рисунок 2.8 - Вторая скалярная компонента квазиреальной сцены Рисунок 2.9 - Третья скалярная компонента квазиреальной сцены

 


селя сцены должны получить на всех скалярных компонентах одни и те же координаты. К сожалению, выполнить без погрешности эти операции не удалось.

Довольно часто в компьютерных экспериментах используются изображения реальных сцен после внесения в них тех или иных изменений. Такая модификация применяется обычно для получения изображений с нужными свойствами. В настоящей работе модифицированные изображения используются для снижения отрицательного влияния на результаты дешифрирования операции пространственного совмещения скалярных компонент. За свое сходство с реальными изображениями они будут называться квазиреальными. В качестве примера на рисунках 2.7-2.9 приведены квазиреальные изображения, полученные путем модификации реальных изображений, приведенных на рисунках 2.4-2.6. Модификация заключалась в построении (дорисовывании) с помощью компьютера на всех ком­­-понентах в одних и тех же местах изображений восьми дополнительных объектов, которых не было на реальной сцене. Предполагается, что объекты имеют прямоугольную форму, случайные координаты и ориентацию. Их размеры и форма были выбраны такими же, как и у реальных объектов. Предполагается, что каждый объект является фрагментом бернуллиевского или однородного случайного поля. В качестве средних значений и дисперсий дополнительных объектов служат оценки соответствующих параметров, подсчитанные по реальным изображениям. Квазиреальные изображения бу­­дут использоваться далее в компьютерных экспериментах для иллюстрации теоретических результатов. Для удобства рядом с изображением каждого добавленного объекта указан его порядковый номер.

 

2.4 Объекты с признаком пятна и зоны интереса

 

Диаметр, связность и граница под­множества решетки. Определение пятна. Исходная информация об объекте. Трехэтапный подход к решению задачи поиска объектов.

 

Предполагается, что целью дешифрирования является выявление (обнаружение) на сцене заданных объектов. Объект будет считаться обнаруженным, если указаны его координаты , вы­численные по проекции следующим образом

 

, .

 

Значения признаков присутствующих на сцене объектов отличаются большим разнообразием. Визуальный анализ изображений, полученных в различных спектральных зонах оптического диапазона, позволяет сделать важное наблюдение. Оказывается, что довольно часто средняя яркость выявляемых объектов оказывается выше или ниже средней яркости их окружения, хотя бы в одной спектральной зоне. Отмеченный эффект особенно характерен при съемке в спектральных зонах инфракрасного диапазона, где энергетическая яркость объекта определяется в значительной степени его термодинамической температурой. В качестве примера такой ситуации можно назвать крупномасштабную съемку с летательных или космических аппаратов с целью выявления на естественных фонах объектов, в конструкциях которых преобладают металлы: транспортных средств, летательных аппаратов, потерпевших аварию или находящихся на аэродромах, морских судов, оказавшихся в воде людей. Объекты с отмеченным свойством составляют довольно широкий класс и поэтому заслуживают определенного внимания.

По-видимому, впервые исследование таких объектов, названных пятнами, было предпринято Куком и Розенфельдом в [1]. К сожалению, их определение и предложенное позднее определение Пикетта (Pickett R.M.) [64], содержат важное ограничение, касающееся формы проекции объекта. В их изложении она должна быть квадратом со сторонами параллельными осям координат. В настоящей работе предлагается определение пятен с проекцией произвольной формы.

Вначале сформулируем определение пятна. Для этого будут использоваться известные понятия связного множества и границы множества, приспособленные к подмножествам из . В самом деле, пусть - евклидово расстояние на . Диаметром объекта будет называться диаметр его проекции , определяемый обычным образом

 

.

 

Таким образом, диаметр объекта, состоящего из одного пикселя, равняется нулю, а его площадь, измеряемая числом пикселей проекции, равняется единице. Очевидно, что при различных и из имеет место неравенство . Поэтому пиксели и , для которых выполняется , будут называться соседями. При евклидовом расстоянии каждый узел имеет четырех соседей. Если используется чебышевское расстояние, определяемое равенством

 

,

 

то количество соседей возрастает до восьми. Понятие соседства, определенное для пикселей, переносится естественным образом на объекты. В самом деле, если и - произвольные объекты, то расстоянием между ними будет называться расстояние между их проекциями, определяемое обычным образом

 

.

 

Объекты и , для которых , будут называться соседями (как и пиксели). Для соседних объектов и всегда предполагается, что .

Подмножество на назовем связным, если для любых двух различных точек и из существует последовательность из точек , принадлежащих и таких, что , и , . Подмножество называется односвязным, если его дополнение является связным. Предполагается, что проекции рассматриваемых в настоящей работе объектов, являются односвязными.

Пусть - подмножество на . Точку из назовем граничной, если у нее есть хотя бы один сосед из . Границей будет называться подмножество , состоящее из граничных точек .

Объект с односвязной проекцией будет называться пятном, если выполняются три условия. Во-первых, существует квадрат на такой, что , во-вторых, , , и, наконец, если . Назовем пятно светлым при и темным, если . Семейство будет называться далее окружением пятна или его фоном, а - зоной интереса.

Обращаем внимание на три важных обстоятельства, которые будут использоваться далее при решении задачи поиска объектов. Предполагается, что пиксель на сцене является квадратом с известной стороной, что известны форма, площадь и другие геометрические признаки пятна, определяемые его проекцией. Наконец, предполагается, что средние значения энергетических яркостей объекта и фона неизвестны, но отличаются друг от друга. Перечисленные обстоятельства отражают реальную ситуацию, которая заключается в том, что энергетические яркости пикселей очень изменчивы. Поэтому предсказать их значения с нужной точностью, как правило, не удается. Также отсутствуют априорные сведения об ориентации объектов, распределениях их энергетических яркостей и числовых характеристиках.

Для вычисления геометрических признаков объекта требуется располагать его проекцией. Построение проекций присутствующих на сцене объектов называется, как известно, сегментацией. Очевидно, что сегментация фрагмента сцены, содержащего только один заданный объект и некоторое его окружение, является более простой задачей, чем сегментация всей сцены. Поэтому поиск объектов предлагается начинать с решения вспомогательной задачи. Она заключается в выявлении на сцене упомянутых выше фрагментов. Для пятен существование таких фрагментов, названных выше зонами интереса, следует из их определения.

Поиск зон интереса является первым этапом выявления на сцене заданных объектов. На втором этапе вычисляется проекция, оказавшегося в зоне интереса объекта. Для этого выполняется сегментация зоны интереса, заключающаяся в определении принадлежности каждого пикселя зоны интереса к одному из двух множеств (классов). При этом предполагается, что пиксели объекта образуют класс с номером 1, а пиксели его окрестности – класс с номером 2. Полученная проекция используется на третьем этапе для вычисления геометрических признаков и классификации объекта.

 

<== предыдущая лекция | следующая лекция ==>
Источники. Велицкий C.8L Справочная книга по земской статистике | Часть I
Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.038 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал