Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Методы морфологического анализа изображений

Покупка
Основная коллекция
Артикул: 617404.02.99
Рассмотрено математическое понятие формы изображения как (инвариантной относительно условий получения изображения) характеристики геометрической формы изображенного объекта. Рассмотрены основанные на понятии формы изображения методы морфологического анализа изображений, ориентированные на компьютерные решения задач анализа и интерпретации изображенных объектов при априорной неопределенности условий регистрации их изображений, таких, в частности, как характер освещения, его спектральный состав и т. п. Типичными являются задачи, в которых даны два изображения одной и той же местности, полученные в разное время при различных и неизвестных условиях освещения, и требуется выделить объекты, представленные на первом (втором) изображении и отсутствующие на втором (первом) изображении. Для специалистов по математическому моделированию, а также для студентов старших курсов и аспирантов технических и физико-математических специальностей вузов.
Пытьев, Ю. П. Методы морфологического анализа изображений [Электронный ресурс] / Ю. П. Пытьев, А. И. Чуличков . - Москва : ФИЗМАТЛИТ, 2010. - 336 с. - ISBN 978-5-9221-1225-3. - Текст : электронный. - URL: https://znanium.com/catalog/product/544778 (дата обращения: 25.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Пытьев Ю.П.
Чуличков А.И.

Методы

морфологического

анализа изображений

МОСКВА

ФИЗМАТЛИТ ®

ОГЛАВЛЕНИЕ

П р е д и с л о в и е . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9

В в е д е н и е . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13

Ч а с т ь I.
Форма полутонового изображения
Г л а в а 1.
Основные понятия морфологического анализа . . . . . . . .
26

1.1. Математические модели изображения . .. . . . . . . . . . . . . . . . . . .
26
1.1.1. Линейное пространство изображений (26). 1.1.2. Пространство изображений L2
μ(X) (27).
1.1.3. Пространство изображений
C(X) (28).

1.2. Понятие формы изображения. Сравнение изображений по форме . .
29
1.2.1. Модель и форма мозаичного изображения (30).
1.2.2. Операция сравнения изображений по форме (33).

1.3. Форма изображения как оператор проецирования . .. . . . . . . . . . .
37
1.3.1. Форма как оператор проецирования на множество Vf в пространстве L2
μ(X) (37). 1.3.2. Аппроксимация в L2
μ(X) формы произвольного изображения (39).
1.3.3. Форма как оператор проецирования на множество Vf в пространстве C(X) (40). 1.3.4. Форма
как линейное множество в пространстве C(X) (41).

1.4. Форма фрагмента изображения . .. . . . . . . . . . . . . . . . . . . . . . .
43
1.4.1. Модель изображения объекта на произвольном фоне и его
форма (43). 1.4.2. Форма деформированного фрагмента изображения (44).

1.5. Примеры форм изображений . .. . . . . . . . . . . . . . . . . . . . . . . . .
46
1.5.1. Форма кусочно гладкого изображения (46).
1.5.2. Форма
размытого изображения (50).
1.5.3. Форма контурного изображения (51).
1.5.4. Форма изображения ламбертова объекта (53).
1.5.5. Форма изображения произвольного объекта, освещаемого
конечным числом источников света произвольной интенсивности (62).

1.6. Решение задач морфологического анализа изображений . .. . . . . . .
63
1.6.1. Узнавание
объекта
по
форме
его
изображения
(63).
1.6.2. Классификация объектов по форме их изображений (63).
1.6.3. Выделение отличий
по форме (65).
1.6.4. Оценивание
параметров объекта по форме его изображения (65).

1.7. Морфологические и корреляционные методы анализа изображений
67

Оглавление

1.8. Независимость по форме . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
1.8.1. Независимость изображений по форме, заданной как линейное подпространство L2
μ(X) (70).
1.8.2. C-эквивалентные изображения (74). 1.8.3. Ранг корреляции форм изображений (78).

Г л а в а 2.
Форма изображения с заданной упорядоченностью яркостей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80

2.1. Изображения с известной упорядоченностью яркостей в пространстве L2
μ(X). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
2.1.1. Мозаичные изображения с упорядоченными яркостями (80).
2.1.2. Сравнение по форме изображений с упорядоченной яркостью (84).
2.1.3. Аппроксимация проектора на конус (85).
2.1.4. Эквализация и форма изображений (88).
2.1.5. Независимость изображений по форме, заданной в виде выпуклого замкнутого конуса (91).

2.2. Изображения с упорядоченными яркостями в пространстве C(X ). .
91

Г л а в а 3.
Морфологический анализ изображений, заданных с погрешностью . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94

3.1. Анализ изображений, искаженных ограниченной погрешностью . .
94

3.2. Анализ изображений, искаженных неограниченной погрешностью
95
3.2.1. Близость изображения к форме, заданной как линейное
подпространство
евклидова
пространства
изображений
(95).
3.2.2. Инвариантные свойства функционала близости изображения
ξ к заданной форме (98).
3.2.3. Анализ формы изображения как
элемента функционального пространства (101).

3.3. Сравнение по форме двух изображений, регистрируемых с погрешностью . .. . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
103

Ч а с т ь II.
Стохастические методы
анализа формы
Г л а в а 4.
Морфологический
анализ
изображений,
искаженных
случайным шумом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
108

4.1. Модель регистрации, искажающей изображение случайным шумом
108

4.2. Форма как линейное подпространство Rn . . . . . . . . . . . . . . . . .
110
4.2.1. Узнавание изображения, искаженного шумом ограниченной
энергии (110).
4.2.2. Узнавание изображения, искаженного шумом неограниченной энергии (111).
4.2.3. Принцип максимума
надежности при классификации изображений, искаженных гауссовым шумом (114).
4.2.4. Оценка параметров объекта по его
зашумленному изображению (118).
4.2.5. Случайные множества,
оценивающие значение параметра сцены по ее изображению (121).

4.3. Форма как выпуклый замкнутый конус V ⊂ Rn . . . . . . . . . . . . .
124
4.3.1. Близость изображения к форме V (124). 4.3.2. Оценивающие
множества.
Форма
как
выпуклый
замкнутый
конус
(126).
4.3.3. Оценка параметра формы изображения, минимизирующая

Оглавление
5

максимальную
погрешность
при
гарантированной
надежности (129).

Г л а в а 5.
Эмпирическое построение случайной формы изображения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
130

5.1. Аппроксимация формы изображения, искаженного случайным шумом . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
130
5.1.1. Аппроксимация формы изображения
формой мозаичного
изображения (130).
5.1.2. Надежность мозаичной аппроксимации
формы изображения при заданном разбиении поля зрения (133).
5.1.3. Надежность мозаичной аппроксимации формы изображения.
Общий случай (134).

5.2. Аппроксимация формы изображения параметрическим семейством
подпространств . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
136
5.2.1. Форма
изображения
как
семейство
линейных
подпространств (136). 5.2.2. Выбор наиболее надежного подпространства
заданной размерности для аппроксимации входного сигнала (138).
5.2.3. Выбор размерности аппроксимации (139).
5.2.4. Связь с
методом максимального правдоподобия (140).
5.2.5. Результаты
вычислительных экспериментов (141).

5.3. Аппроксимация формы множества изображений . .. . . . . . . . . . . .
145
5.3.1. Эффективная размерность множества изображений (145).
5.3.2. Эффективная размерность множества классов эквивалентности изображений (149).

Ч а с т ь III.
Возможностные методы анализа формы

Г л а в а 6.
Вероятностные и возможностные модели формы изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
153

6.1. Вероятностные и возможностные модели морфологического анализа
изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
153

6.2. Возможностная модель изображения и его интерпретации . .. . . . .
156
6.2.1. Модель регистрации изображения (156). 6.2.2. Анализ изображений, искаженных аддитивным шумом (159).

6.3. Примеры задания меры возможности на множестве изображений. .
160
6.3.1. Форма как «четкое» множество (160). 6.3.2. Нечеткая форма
изображения при деформации поля зрения (161). 6.3.3. Форма как
множество изображений с известной упорядоченностью яркостей
точек поля зрения (162).

Г л а в а 7.
Стохастические модели возможности в задачах анализа
изображений . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
165

7.1. Возможность в статистической теории проверки гипотез . .. . . . . .
165
7.1.1. Область принятия гипотезы и ее связь с оценивающим множеством (165). 7.1.2. Нечеткий параметр распределения случайного элемента. Простые гипотезы и альтернативы (167). 7.1.2. Нечеткий параметр распределения случайного элемента. Сложные гипотезы и альтернативы (168).

Оглавление

7.2. Возможность на множестве значений параметра формы изображения . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
168
7.2.1. Возможность,
индуцированная
результатом
регистрации
изображения с шумом заданной дисперсии (168).
7.2.2. Возможность, индуцированная результатом регистрации изображения
с шумом неизвестной дисперсии (170).

7.3. Эмпирическое построение нечеткой формы изображения . .. . . . . .
173

Ч а с т ь IV.
Цветные изображения

Г л а в а 8.
Морфологический анализ цветных изображений . . . . . .
177

8.1. Математическая модель цветного изображения. .. . . . . . . . . . . . .
178
8.1.1. Цвет и яркость (178).
8.1.2. Цветное (спектрозональное)
изображение (182).

8.2. Форма цветного изображения . .. . . . . . . . . . . . . . . . . . . . . . . .
184
8.2.1. Сравнение
цветных
изображений
по
форме
(185).
8.2.2. Форма мозаичного цветного изображения (187).
8.2.3. Общее понятие формы цветного изображения (192).

8.3. Аппроксимация формы цветных изображений. .. . . . . . . . . . . . . .
193
8.3.1. Форма
как
оператор
наилучшего
приближения
(193).
8.3.2. Приближение цветного изображения изображениями, цвет
и
яркость
которых
постоянны
на
заданных
подмножествах
разбиения {Ai} поля зрения X (194).
8.3.3. Аппроксимация

формы в широком смысле произвольного изображения ⃗f(·) (197).
8.3.4. Приближение
цветного
изображения
мозаичными
изображениями
с
заданным
конечным
набором
значений
(200).
8.3.5. Приближение
цветного
изображения
мозаичными
изображениями с конечным числом значений вектора цвета (203).
8.3.6. Приближение
цветного
изображения
изображениями,
цвет которых постоянен на заданных подмножествах разбиения
{Aj}
поля
зрения
X
(204).
8.3.7. Приближение
цветного
изображения
изображением
с
заданным
набором
значений
вектора цвета (210).
8.3.8. Приближение цветного изображения
изображением с конечным числом значений вектора цвета (213).
8.3.9. Форма
изображения
с
заданным
распределением
цвета
→ϕ(x), x ∈ X (214). 8.3.10. Случай, когда допускаются небольшие
изменения цвета в пределах каждого Ai, i = 1, ... , N (215).

8.4. Форма цветного изображения как оператор наилучшего приближения в чебышевской метрике. .. . . . . . . . . . . . . . . . . . . . . . . . . .
221

8.5. Задачи морфологического анализа цветных изображений . .. . . . . .
224
8.5.1. Задачи идентификации при произвольно меняющейся интенсивности освещения (224). 8.5.2. Задачи совмещения изображений
и поиска фрагмента (225). 8.5.3. Задача анализа спектрозональных
изображений (226).

Оглавление
7

Ч а с т ь V.
Прикладные задачи
Г л а в а 9.
Примеры
решения
задач
морфологического
анализа
изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
228

9.1. Морфологическое подавление случайного шума . .. . . . . . . . . . . .
228
9.1.1. Подавление шума на кусочно постоянном изображении (228).
9.1.2. Подавление шума на произвольных изображениях (233).

9.2. Выделение неизвестного объекта на фоне, форма изображения которого известна . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
237
9.2.1. Морфологический метод (237).
9.2.2. Локальный морфологический алгоритм (239).
9.2.3. Локальный корреляционный метод (241).
9.2.4. Локальный метод ранговой корреляции (242).
9.2.5. Сравнение алгоритмов (242).

9.3. Аппроксимация формы текстурнозначного изображения . .. . . . . . .
244

9.4. Морфологический метод сжатия изображений текста. .. . .. . . . . . .
250
9.4.1. Математическая модель и форма изображения текста (251).
9.4.2. Алгоритм
морфологического
сжатия
изображения
текста (254).

9.5. Фильтрация гладкого фона . .. . . . . . . . . . . . . . . . . . . . . . . . . .
258
9.5.1. Математическая модель и форма изображения фона и сигнала (258).
9.5.2. Постановка и решение задачи фильтрации фона (259).

9.6. Поиск области интерлейсинга . .. . . . . . . . . . . . . . . . . . . . . . . .
261
9.6.1. Модель изображения, искаженного интерлейсингом (262).
9.6.2. Морфологический
метод
поиска
области
интерлейсинга (263).

9.7. Измерение микрорельефа поверхности по набору его изображений
264
9.7.1.
Математическая
модель
мультифокусного
изображения (265).
9.7.2. Задача оценивания высоты рельефа поверхности (266).
9.7.3. Оценка высоты рельефа как оценка параметра
формы (267).

9.8. Классификация изображений и оценка параметров системы регистрации . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . .
270
9.8.1. Математическая модель формирования изображения (270).
9.8.2. Классификация и оценка параметров измерительной аппаратуры (271).

9.9. Цветовая сегментация на основе морфологического фильтра . .. . . .
273

9.10. Поиск отличий по форме в цветных изображениях . .. . . . . . . . . .
275

П р и л о ж е н и я. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
276

A.1. Множества, подмножества, линейные пространства . .. . . . . . . . . .
276
A.1.1. Отношения. Частично упорядоченные множества. Решетки (276).

A.2. Линейные операторы в пространствах изображений. .. . . . . . . . . .
278
A.2.1. Линейные операторы в евклидовых пространствах (278).
A.2.2. Операторы ортогонального проецирования (278). A.2.3. Ко
Оглавление

нечномерная аппроксимация формы в
широком смысле (280).
A.2.4. Псевдообратный оператор (282).

A.3. Операторы проецирования на выпуклые замкнутые множества . .. .
284
A.3.1. Задача наилучшего приближения в нормированном пространстве (284). A.3.2. Выпуклое замкнутое множество евклидова
пространства и проекторы на него (284).
A.3.3. Аппроксимация
проектора на выпуклое замкнутое множество (288).
A.3.4. Проектор на выпуклый замкнутый конус евклидова пространства
Rn (290).

A.4. Случайные элементы евклидова пространства. .. . . . . . . . . . . . . .
296
A.4.1. Определение
и
свойства
случайных
элементов
(296).
A.4.2. Нормально распределеные случайные элементы евклидова
пространства. Распределения Пирсона и Снедекора–Фишера (297).

A.5. Методы проверки статистических гипотез . .. . . . . . . . . . . . . . . .
299
A.5.1. Нерандомизированный и рандомизированный критерии проверки статистической гипотезы (299).
A.5.2. Симметрия задачи
проверки гипотез. Инвариантные критерии (301).
A.5.3. Симметрия задачи проверки гипотезы о независимости математического ожидания предъявляемого изображения от формы LN (303).
A.5.4. Надежность статистической гипотезы. Простая гипотеза
и простая альтернатива (307).
A.5.5. Минимаксная надежность
сложной гипотезы при сложной альтернативе (311). A.5.6. Оценки
максимальной надежности (315).

A.6. Возможность как альтернативная вероятности модель случайности
316
A.6.1. Вероятность: проблемы эмпирического построения и интерпретации (316). A.6.2. Возможность как мера предопределенности
исходов стохастического эксперимента (317). A.6.3. Классы эквивалентных возможностей (318).
A.6.4. Шкала значений возможности. Возможность события (318). A.6.5. Необходимость. Шкала
значений необходимости (320). A.6.6. Возможность, максимально
согласованная с вероятностью (321). A.6.7. Возможность: эмпирическая интерпретация и эмпирическое построение (322).

A.7. Элементы теории возможностей . .. . . . . . . . . . . . . . . . . . . . . . .
324
A.7.1. Интеграл. Определение и свойства (324).
A.7.2. Мера возможности. Определение и свойства (326). A.7.3. Принцип относительности (327). A.7.4. Нечеткие множества (328). A.7.5. Нечеткие элементы (329). A.7.6. Нечеткие события (329).

С п и с о к л и т е р а т у р ы. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
331

Предисловие

Одним из самых эффективных инструментов получения информации об окружающем мире для человека является зрение. «Лучше один
раз увидеть, чем сто раз услышать», — гласит народная поговорка.
Действительно, с первого взгляда мы можем узнать знакомый предмет
на своем рабочем столе или заметить, что кто-то нарушил знакомый
порядок расположения предметов. Мы легко узнаем человека по его
фотографии и выделяем в ряду изображений знакомые лица. «На глаз»
мы можем оценить взаимное расположение предметов, их размеры
и другие характеристики. Ко всему этому можно еще добавить, что
подобные задачи мы решаем как при ярком солнечном свете, так
и в
сумерки, и при искусственном освещении, по фотографии или
даже по рисунку. При этом качество изображений не играет заметной
роли — даже малоконтрастные и сильно зашумленные фотографии
подчас несут достаточно информации для узнавания изображенного
объекта или сцены.
Эта легкость во многом определила интерес исследователей к изучению алгоритмов работы зрительного анализатора живых организмов;
прогресс в этой области позволил бы конструировать автоматы, способные заменить человека во многих областях его деятельности. И хотя
успехи в создании систем машинного зрения достигнуты впечатляющие, до сих пор такие системы не могут конкурировать с человеком
при решении сложных задач распознавания, классификации и пр.
Возможно, одной из причин является то, что изображение, как правило, рассматривается в отрыве от модели его формирования. С формальной точки зрения изображением является скалярная или векторная функция, заданная на подмножестве плоскости, ее значения интерпретируются как яркость изображения. Стандартные методы анализа
изображений состоят в применении к ним тех или иных преобразований, известных в математике или специально сконструированных для
тех или иных целей [14, 15, 20, 27, 31, 35, 37, 65, 66, 85]. Результатом
этих операций является некоторая система признаков, характерных для
заданного класса изображений; далее методами теории распознавания
образов [9–11, 19, 21, 61, 64, 90] решаются многие практические задачи. Однако как выбор признаков, так и способы оценки их значений —
достаточно трудные задачи.

Предисловие

В отличие от описанного выше подхода морфологические методы
анализа изображений основаны на математических моделях, связывающих изображения с объектами изображаемой сцены и условиями их
регистрации. Если речь идет об анализе сцены, а не об анализе изображения как такового (как объекта исследования), то все изменения
изображения сцены, возникающие при изменении условий получения
изображения (освещения, характеристик видеокамеры и т. п.), следует
признать несущественными. С самых общих позиций анализатор сцены
по ее изображениям можно представить как «черный ящик», на вход
которого поступает изображение, а на выходе содержатся сведения,
позволяющие высказываться о содержании сцены. В идеале выходной
сигнал «черного ящика» — характеристики объектов сцены — остается прежним, если в широких пределах менять свойства входного
изображения, связанные с изменением освещенности сцены, разрешающей способности системы формирования видеоинформации и др., но
не обусловленные изменением «геометрии» сцены. С другой стороны,
изменения в самой сцене — удаление или добавление предметов, изменение их взаимного расположения, т. е. такие, которые не могут быть
вызваны изменением условий наблюдения, — приводят к изменениям
на выходе анализатора.
Центральным понятием морфологических методов анализа служит
понятие формы изображения, понимаемой как часть информации,
сохраняющаяся при вариациях условий формирования изображения.
Формально она может быть определена, например, как инвариант преобразований, моделирующих изменения условий формирования изображений сцены.
Рассмотрим примеры задач, которые не могут быть решены без
использования морфологических методов анализа изображений.
На рис.П.1 приведен ряд изображений, на которых наблюдатель
видит практически одну и ту же сцену, узнает знакомые предметы,
может оценить их форму, взаимное расположение, размеры. Можно
заметить, что в правом нижнем углу изображения П.1, в, отсутствует
фрагмент («бочка»), имеющийся на изображениях П.1, а и б (см. цветную вклейку).
В то же время нельзя сказать, что эти изображения одинаковы —
они отличаются яркостью и контрастом. Но эти отличия обусловлены
не свойствами сцены, а условиями регистрации — характером освещения сцены, чувствительностью видеокамеры и т. п. Выделяя информацию о предметах сцены, человек даже не задумывается о том, каково
время экспозиции, откуда падает свет и т. п. Формальная постановка
задачи узнавания сцен по их изображениям является одной из целей
морфологических методов анализа изображений, описанных в данной
монографии.

Предисловие
11

Рис. П.2

Другой пример связан с проблемой поиска заданного знака, например буквы «А», на странице книги. Для человека эта задача требует напряженного внимания, особенно если страница частично залита
краской и плохо освещена. Морфологические методы позволяют уверенно отыскивать знаки заданной формы даже в сложной помеховой
обстановке, такой, например, какая изображена на рис.П.2.
Известно, что можно определять «на глаз» расстояние между предметами, их размер, причем при размытых сливающихся с фоном границах объектов это делать труднее. Однако именно в таких условиях приходится работать при исследовании наночастиц, см. рис.П.3.
Морфологические методы построены таким образом, что гарантируют
максимальную точность определения координат центров и радиусов
частиц нанопорошка.

Рис. П.3

Предисловие

Рис. П.4

Еще один пример применения морфологических методов связан
с проблемой совмещения сигналов, «в целом» достаточно схожих,
но отличающихся деталями, см. рис.П.4; совмещение осуществляется
путем сдвигов сигнала вдоль оси абсцисс. Эта задача возникает при
определении временн´ой задержки выходных сигналов трех микрофонов, регистрирующих акустический сигнал; значение относительного
времени задержки сигналов на выходе микрофонов позволяет определить направление на источник звука. Различие трасс распространения
звука обуславливает вариации регистрируемого звукового давления при
сохранении общих особенностей сигнала. Морфологические методы
позволяют дать формальное описание сходства сигналов и дают максимально точную оценку времени сдвига.
В настоящей книге описаны методы анализа и интерпретации изображений сцен, основанные на понятии формы изображения. Морфологический подход является еще одним шагом на пути анализа изображений с точки зрения содержащейся в нем информации, важной для
решения поставленной задачи.
Издание этой книги стало возможным благодаря финансовой поддержке Российского фонда фундаментальных исследований (грант
№ 09-07-07013) и помощи наших друзей и коллег. Авторы глубоко благодарны И. Богданову, В. Баскакову, С. Введенскому, Д. Делюкину, Д. Демину, Г. Животникову, А. Захарченко, В. Илюшину, П. Кобыльчаку, А. Корнильеву, И. Морозовой, Д. Устинину, И. Фаломкину,
О. Фаломкиной, В. Шишакову и другим, предоставившим результаты
расчетов, иллюстрирующих морфологические методы анализа данных.

Введение

Рассмотрим ряд изображений на рис. В.1 (см. цветную вклейку).
Легко заметить, что это изображения одного и того же объекта — цветка горицвета. Наблюдатель воспринимает содержание изображенной
сцены как неизменное, даже если яркость, контраст, цветовая гамма
изображения изменяются в широких пределах. Из этого можно сделать
вывод, что для решения таких задач, как узнавание и классификация
объектов, оценивание их геометрической формы и т. п., важны не
точные значения яркости и/или цвета изображения в каждой точке
поля зрения, а знание некоторых структур на поле зрения, которые вызывают зрительное впечатление цветка и не меняются при изменении
яркости, контраста и т. п.
С другой стороны, в реальных условиях нам, как правило, недоступна информация об условиях формирования изображения, позволяющая однозначно связать яркость и цвет изображения со свойствами изображаемых объектов сцены. Та совокупность математических
характеристик изображений, которая независимо от условий их регистрации позволяет выделять, узнавать объекты и оценивать их геометрические характеристики, выделять эволюционирующие во времени
элементы сцены на ее изображениях, полученных при произвольно
меняющихся условиях регистрации и т. п., получила название формы
изображения, а представленные в этой книге математические методы
анализа и интерпретации изображенных сцен названы морфологическими [40, 47, 77–79]. Основу морфологических методов анализа изображений составляют математические модели и специально разработанный математический формализм, позволяющие охарактеризовать изображения в терминах инвариантов преобразований распределений их
яркости и цвета по полю зрения, сохраняющих информацию, необходимую для решения поставленной задачи. Принципам морфологического
анализа изображений и сигналов посвящены работы [40, 47, 77–79].
Проиллюстрируем понятие формы изображения на простом примере. Рассмотрим полутоновые монохромные (gray-scale) изображения
однородно освещенного кубика, рис. В.2, полученные с помощью фотоаппарата. На нем представлены фрагменты, изображающие три видимые грани кубика, и фон. Благодаря однородности освещения и постоянству оптических свойств граней кубика и фона эти фрагменты

Введение

Рис. B.2. Изображения кубика при различных условиях наблюдения

изображения имеют примерно одинаковую яркость. Изменения условий
однородного освещения приводят к изменению яркостей этих фрагментов, но геометрические свойства однородно освещенных и окрашенных областей поля зрения останутся прежними — они определяются
формой объекта, геометрическими свойствами его поверхности и не
зависят от условий регистрации изображений.
Следовательно, существенным для передачи геометрических характеристик кубика является разбиение поля зрения на множества
примерно одинаковой яркости, а несущественным — яркость этих областей. В качестве модели каждого изображения кубика примем функцию, заданную на прямоугольной области (на поле зрения), разбитой
на подмножества, соответствующие видимым граням кубика и фону.

Рис. B.3.
Модель
изображения
кубика
как кусочно постоянное
изображение

Значения
функции
определяются
яркостью
изображения, они постоянны на каждом из
подмножеств, см. рис. В.3. Изменяя яркость
каждого из подмножеств в произвольных пределах, получим множество всех изображений
кубика, которые могут быть получены при вариации условий их регистрации.
В этом случае решение задачи узнавания
сцены (кубик в заданном ракурсе на однородном фоне при однородном освещении) состоит в том, чтобы проверить, принадлежит ли
предъявленное изображение, обозначим его f,
этому множеству изображений или нет. Факт
принадлежности изображения f указанному
множеству означает, что можно указать условия регистрации, при которых полученная фотография с приемлемой точностью совпадет с предъявленным изображением, и, следовательно, нет причин утверждать, что f не изображает
заданную сцену с кубиком. В противном случае f не может быть
порождено кубиком ни при каких условиях наблюдения — его следует
признать изображением другой сцены.

Введение
15

Инвариант условий регистрации — в рассматриваемом примере
множество всех изображений кубика — называется формой изображения 1).
Описанный здесь подход может быть применен для узнавания произвольной сцены, представленной полутоновым изображением. Рассмотрев изображения сцены, полученные при всех возможных условиях их регистрации, получим множество V всех изображений рассматриваемой сцены. Это множество называется формой изображения
сцены. Охарактеризовать его можно, задав конструктивную процедуру
проверки принадлежности любого изображения этому множеству. Например, если изображения рассматриваются как элементы некоторого
метрического пространства R, так что определено расстояние между
любыми двумя изображениями, а множество V замкнуто в R, то такой
процедурой является вычисление расстояния от предъявленного изображения до множества всех возможных изображений сцены. (Расстояние от некоторого элемента f до заданного множества V определяется
как точная нижняя грань расстояний от f до элементов множества V;
для замкнутых множеств точная нижняя грань достигается на некотором элементе Pf множества V, его называют проекцией f на V.)
Равенство нулю этого расстояния означает, что f ∈ V, т. е. что предъявлено изображение рассматриваемой сцены, отвечающее некоторым
условиям регистрации.
В рассмотренном примере инвариантным относительно условий регистрации является равенство или неравенство нулю расстояния между
предъявленным изображением и его проекцией на множество всех
изображений сцены, и форма изображения сцены в этом случае может
быть отождествлена с операцией вычисления проекции. В этой книге
методы анализа изображений в терминах их формы называются методами морфологического анализа.
Очертим круг задач, для решения которых используются методы
морфологического анализа.

Задача узнавания объекта по его изображению. С формальной
точки зрения, узнать заданную сцену или объект на изображении —
значит, определить, может ли эта сцена или объект при некоторых
условиях регистрации дать предъявленное для анализа изображение.
Рассмотрим для примера изображение листа календаря, приведенное на рис. В.4, a. Несмотря на весьма низкое качество изображения,
можно заметить, что в каждой таблице числа, означающие дни месяца,
содержат три изображения цифры «пять». Но как указать формальное

1) В данном случае форма изображения кубика содержит все, что может
сообщить о геометрической форме кубика его изображение.

Введение

Рис. B.4. a) Изображение календаря. б)–г) Изображения цифры «пять». д) Результат узнавания; есть пропущенные фрагменты. е) Результат узнавания;
имеются ложные срабатывания

правило, которое позволит узнать изображение этой цифры «автоматически», независимо от условий получения изображения В.4, a?
В простейшей ситуации для решения этой задачи морфологическими методами следует определить форму изображения цифры «пять».
Рассмотрим для этого увеличенное изображение цифры «пять», взятое
из фрагмента изображения календаря, соответствующего дате «25 февраля», см. рис. В.4, б. Будем считать, что все другие изображения
цифры «пять» получены из него путем нелинейного преобразования
его яркости (варианты таких изображений приведены на рис. В.4, в, г).
Множество V таких изображений будем считать формой изображения
фрагмента, содержащего изображение цифры «пять». Изображения из
множества V будем считать сравнимыми по форме с изображением
цифры «пять» на рис. В.4, б. Все изображения, не содержащиеся в множестве V, будут не сравнимы по форме с изображением, приведенным
на рис. В.4, б. В этом смысле формой изображения цифры «пять» можно
считать множество изображений, сравнимых с ним по форме.

Введение
17

В идеальном варианте узнавание цифры «пять» на предъявленном фрагменте сводится к выяснению, принадлежит ли указанный
фрагмент определенной таким образом форме изображения. Однако
фрагменты изображения, содержащие другие цифры «5», отличаются
от рис.В.4, б, не только преобразованием яркости: на изображении
присутствуют шумы, знаки могут быть плохо пропечатаны и т. п.
Поэтому будем считать, что в предъявленном фрагменте можно
узнать цифру «пять», если его яркость можно «с достаточной точностью» приблизить изображениями из формы изображения цифры
«пять», т. е. полученными из изображения на рис.В.4, б, нелинейными преобразованиями его яркости (определения понятий «точность
приближения», «нелинейное преобразование яркости» и др. будут даны ниже в зависимости от рассматриваемых математических моделей
изображений).
Результат поиска участков поля зрения, содержащих изображение
цифры «пять», приведен на рис. В.4, д, е. Найденные участки выделены
белыми прямоугольниками. Фрагменты изображения на выделенных
участках признавались изображением цифры «пять», если отличие
(например, норма разности) между приближаемым фрагментом и его
проекцией на множество всех изображений этой цифры (проекцией
«должным образом» сдвинутого фрагмента на форму изображения цифры «пять») не превосходило заданный порог.
Изменяя значение порога, можно задавать более или менее жесткие
условия узнавания. Так, малое значение порога привело к результату,
изображенному на рис. В.4, д. Здесь нет ни одного ложного срабатывания, однако оказалась не узнанной цифра в дате «25 сентября», отличающаяся малой контрастностью. Увеличение порога приводит к тому,
что пропущенный ранее фрагмент признается теперь как содержащий
цифру «пять», однако есть и ошибочные узнавания — в датах «26 января», «31 января», «19 февраля» и др.
Поиск фрагмента, сравнимого по форме с изображением знака
«шесть», иллюстрирует рис.В.5. В верхней его части приведено изображение ряда цифр. Изображения искажены небольшим шумом. Область
прямоугольной формы, в которую целиком помещается изображение
одного знака, движется по полю зрения в горизонтальном направлении,
и рассматривается фрагмент изображения, вырезаемый этой областью.
Этот фрагмент приближается изображениями, сравнимыми по форме
с изображением цифры «шесть». График точности этого приближения
приведен на нижней части рис. В.5.
Как видно из рисунка, фрагменты изображения, содержащие цифры
«три», «пять», «восемь», «девять» и «ноль», достаточно близки к форме
изображения цифры «шесть» — об этом свидетельствуют довольно
глубокие локальные минимумы на приведенном графике, однако наи